Artikel
Diagnostik bei Reihenuntersuchungen: ist bei gleicher Spezifität der sensitivste Test immer der Beste?
Suche in Medline nach
Autoren
Veröffentlicht: | 10. September 2008 |
---|
Gliederung
Text
Hintergrund
Für die Bewertung der Nützlichkeit diagnostischer Tests haben verschiedene Autoren ein stufenweises Vorgehen vorgeschlagen [Ref. 1], [Ref. 2]. Hierbei sind nicht nur die Testgüte, sowohl bemessen an den so genannten prävalenzunabhängigen (Sensitivität, Spezifität) als auch den prävalenzabhängigen Testeigenschaften (prädiktive Werte) von Bedeutung. Eine große Rolle spielt die durch den Test (z. B. durch eine Behandlung) bewirkte Änderung des weiteren Krankheitsverlaufs mit Hinblick auf patientenrelevante Zielgrößen (Phase 4 nach Köbberling et al, Level 5 nach Fryback et al. [Ref. 1], [Ref. 2]).
Hierbei kann der Vergleich der Strategien als Ganzes (Kombination von Test und Intervention), basierend auf der Wahl des diagnostischen Tests, nicht unterscheiden, ob beispielsweise bei Fehlen eines Effekts bezüglich eines patientenrelevanten Endpunktes dies auf eine unwirksame Behandlung zurückzuführen ist oder auf das Unvermögen des Tests, von der Behandlung profitierende Patienten zu erkennen. Eine Konsequenz dieses Mangels üblicher Testvalidierungen findet seinen Niederschlag im Phänomen der so genannten Übertherapien.
Allgemein formuliert können solche irrelevanten Krankheitsverläufe entstehen, wenn beispielsweise Frühstadien der Erkrankung einer spontanen Rückbildung unterliegen. Das gleiche gilt für (kausale) Risikofaktoren der Erkrankung. Sie können aber auch entstehen, wenn vorhandene Erkrankungen klinisch nicht wahrnehmbar verlaufen (so genannte stumme Verläufe) und somit auch zu keiner Beeinträchtigung des Betroffenen führen, oder aber die vom Test erkannten Patienten bezüglich der Behandlung refraktär sind. Dies führt zu der (paradoxen) Möglichkeit, dass bei gleicher Sensitivität und gleicher Spezifität zweier Tests, der letztendliche Nutzen der Tests unterschiedlich ausfällt. Dies ist beispielsweise dann der Fall, wenn der betreffende Test im Falle einer spontanen Regression der Erkrankung „behandlungsbedürftige“ bzw. im Falle einer Responder-Verteilung „behandlungswürdige“ Patienten besser unterscheiden kann).
Zielsetzung
Beschreibung der Relevanz/Irrelevanz positiver Testergebnisse als ein zusätzliches (Güte)Merkmal diagnostischer Tests, das für deren Einsatz in Reihenuntersuchungen von Bedeutung ist.
Methodik
Aus den Erfahrungen bei der Bewertung diagnostischer Test für den Einsatz bei einer Reihenuntersuchung von Kindern im Vorschulalter zur Erkennung von amblyogenen Sehstörungen [Ref. 3] soll ein Vorschlag abgeleitet werden, die Validierung diagnostischer Tests hinsichtlich deren Eignung für ein Screening um den Aspekt der „Relevanz positiver Diagnosen“ zu ergänzen.
Ergebnisse
Unter Einbeziehung des Anteils irrelevant positiver Diagnosen sind Konstellationen möglich, in denen ein Screeningtest dem anderen vorzuziehen wäre, obwohl der Test eine gleiche oder sogar unterlegene Testgüte i. S. einer gleichen/geringeren Sensitivität bei gleicher Spezifität aufweist. Als Konsequenz sollte die (zusätzliche) Information zu irrelevanten positiven Diagnosen zu einem besseren Nutzen-Schaden-Verhältnis des Einsatzes von diagnostischen Tests im Rahmen von Screeningmaßnahmen bezüglich patientenrelevanter Endpunkte führen. Zeigen beispielsweise beide diagnostischen Strategien (siehe Abbildung 1 [Abb. 1]) einen gleichen (äquivalenten) Interventionseffekt würde in Kenntnis des Anteils der irrelevanten positiven Testergebnisse im Falle eines Screenings die Wahl auf die Strategie mit dem geringeren Anteil fallen. Dies ermöglichte eine Reduzierung ggf. vorhandener schädlicher Effekte der Intervention insbesondere dann, wenn die Intervention ein hohes Schadenspotenzial aufweist. Die herausgehobene Bedeutung irrelevanter positiver Diagnosen liegt im Falle eines Screenings in der besonderen Verantwortung für den (definitionsgemäß) größten Teil des adressierten Zielpublikums – den Gesunden, welche in großer Zahl diesem Risiko ausgesetzt sind.
Schlussfolgerung
Für den Einsatz eines diagnostischen Tests bei Reihenuntersuchungen ist es wichtig den Anteil irrelevanter positiver Testergebnisse zu kennen.
Literatur
- 1.
- Köbberling J, Trampisch HJ, Windeler J. Memorandum zur Evaluierung diagnostischer Maßnahmen. Nucl Med 1989; 28: 255-60.
- 2.
- Fryback, DG, Thornbury JR. The efficacy of diagnostic imaging. Med Decis Making 1991; 11(2): 88-94.
- 3.
- Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen. Früherkennungsuntersuchung von Sehstörungen bei Kindern bis zur Vollendung des 6. Lebensjahres. Abschlussbericht S05-02. Köln: IQWiG; 2008.