Kennwerte für die Qualität diagnostischer Tests
Speziell in diagnostischen Studien werden die Ergebnisse in Vierfeldertafeln dargestellt, um die Ergebnisse zusammenzufassen gibt es verschiedene Kennzahlen und Testgütekriterien. In den STARD guidelines (2015) wird vorgeschlagen folgende Kennwerte in diagnostischen Studien zu berichten: Genauigkeit, Sensitivität, Spezifität sowie positiver und negativer prädiktiver Wert.
In einer Vierfeldertafel kann ein diagnostischer Test vier Ergebnisse haben:
- Das Ergebnis ist positiv, und der Patient hat die Krankheit (true positive).
- Der Test ist negativ, aber der Patient hat die Krankheit (false negative).
- Der Test ist positiv, aber der Patient hat die Krankheit nicht (false positive).
- Der Test ist negativ, und der Patient hat die Krankheit nicht (true negative).
Allgemeine Darstellung einer Vierfeldertafel (2x2 Kreuztabelle) zum diagnostischen Test.
Testergebnis/Diagnose | Krank | nicht Krank | Summe |
---|---|---|---|
T+ | a | b | \(a-b\) |
T- | c | d | \(c+d\) |
Summe | \(a+c\) | \(b+d\) | \(a+b+c+d=n\) |
Wichtige diagnostische Testgütekriterien sind in folgender Tabelle aufgelistet die Formeln stammen aus (Sachs 2006) Seite 155.
Begriff | English | Bezeichnung | Berechnung |
---|---|---|---|
Sensitivität (TPR) | sensitivity | Richtig-positiv-Rate, Empfindlichkeit oder Trefferquote | \(tpr = \frac{a}{a+c}\) |
Spezifität (TNR) | specificity | Richtig-negativ-Rate | \(tnr = \frac{d}{b+d}\) |
Positiver prädiktiver Wert (PPV) | precision or positive predictive value | Wahrscheinlichkeit, dass ein Patient mit positivem Testergebnis tatsächlich krank ist | \(ppv = \frac{tpr \cdot pre}{tpr \cdot pre + (1-tnr) \cdot (1-pre))} = \frac{a}{a+b}\) |
Negativer prädiktiver Wert (NPV) | negative predictive value | Wahrscheinlichkeit, dass ein Patient mit negativem Testergebnis tatsächlich gesund ist | \(npv = \frac{tnr \cdot (1-pre)}{(1-tpr)*pre) + (tnr) \cdot (1-pre)} = \frac{d}{c+d}\) |
Genauigkeit (ACC) | Accuracy | Prätestwahrscheinlichkeiten vor dem Test gesund bzw. krank zu sein | \(acc=\frac{a+d}{n}\) |
Prävalenz (PRE) | Prevalence | Schätzwert für den Anteil an Erkrankter in der Grundgesamtheit (nur aussagekräftig bei einer sehr großen Stichprobe) | \(pre = \frac{a+c}{n}\) |
Beispiel
Hier ein fiktives Beispiel, Inspiration ist das Beispiel aus (Bortz 2010) Seite 261. Ein neu entwickelter Schnelltest für die Virale Infektionskrankheit X soll überprüft werden. Goldstandard für die Identifikation der Infektion ist ein PCR-Tests der Fragmente des Virengenoms nachweist. Bei einem positiven Befund dieser ein zweites mal durchgeführt, dadurch ist die Methode zeitaufwendig und teuer. Beim Schnelltest werden die gebildeten Antikörper des Körper des Patienten getestet, was mit einem speziell beschichteten Papierstreifen erfolgt.
Untersucht wurden 187 Patienten generelle Symptome wie Fieber und Atemprobleme aufweisen, die auf eine Infektion durch den Virus X hindeuten.
Tab 1: 2x2 Tabelle zur Bestimmung der Kennwerte | ||||
GoldStandart | ||||
---|---|---|---|---|
Schnell.Test | positiv | negativ | Sum | |
positiv | 111 | 2 | 113 | |
negativ | 12 | 62 | 74 | |
Sum | 123 | 64 | 187 | |
In der Tabelle 2 sind die Kennzahlen Aufgelistet. Aus Sicht des Arztes ist der positive Vorhersagewert (PPV) besonders von Interesse. Der PPV gibt die Sicherheit an mit welcher Wahrscheinlichkeit bei einer positiven Testergebnis die Krankheit vorliegt. Wenn also der Test positiv mit der neuen Methode vorliegt beträgt die Wahrscheinlichkeit, dass die Infektion vorliegt 98.2 %.
Analog ist der negative Vorhersagewert (NPV) definiert. Er gibt den Anteil an nicht erkrankten Patienten bei einem negativen Testergebnis an. Hier im Beispiel mit 83.8 % kann man relativ sicher sein wenn der Test negativ ist, nicht erkrankt zu sein.
Sensitivität (TPR) und Spezifität (TNR) müssen immer gemeinsam betrachtet werden und beide müssen hoch sein. Wobei hoch immer vom Kontext abhängt. Ist eine Krankheit lebensbedrohlich ist eine hohe Sensitivität des Tests wünschenswert. Wenn hingegen keine Therapie bekannt ist oder Nachfolgeuntersuchungen mit einem erheblichen Risiko für den Patienten verbunden sind sollte die Spezifität des Tests möglichst hoch sein. Hier im Beispiel sind die Werte für Sensitivität 90.2 % und für Spezifität 96.9 %.
Tab 2: Point estimates and 95 % CIs: | |
Diagnostic.Parameters | Point.Estimates |
---|---|
Apparent prevalence | 0.60 (0.53, 0.67) |
True prevalence | 0.66 (0.58, 0.73) |
Sensitivity | 0.90 (0.84, 0.95) |
Specificity | 0.97 (0.89, 1.00) |
Positive predictive value | 0.98 (0.94, 1.00) |
Negative predictive value | 0.84 (0.73, 0.91) |
Diagnostic Accuracy | 0.93 (0.88, 0.17) |
Ist nun aber die Prävalenz aus der Literatur bekannt - hier im Beispiel für die Infektionskrankheit X wird 1 % angenommen, ergibt sich für die positiven Vorhersagewerte ein anderes Bild. Der für den Patienten so wichtige PPV sinkt im Beispiel auf 22.6 %. Mit anderen Worten der positive Vorhersagewert ist nicht zu ermitteln wenn der Anteil an Infektionen in der Referenzpopulation unbekannt ist.
Tab 3: Geschätzte prädektive Werte mit verschiedener Prävalenz | ||
Parameter | Prävalenz aus den Daten geschätzt | Prävalenz bekannt |
---|---|---|
Prevalence | 0.658 | 0.01 |
Sensitivity | 0.902 | 0.902 |
Specificity | 0.969 | 0.969 |
Pos Pred Value | 0.982 | 0.226 |
Neg Pred Value | 0.838 | 0.999 |
Literatur
STARD (2015) Cohen, J. F., Korevaar, D. A., Altman, D. G., Bruns, D. E., Gatsonis, C. A., Hooft, L., Irwig, L., Levine, D., Reitsma, J. B., de Vet, H. C., & Bossuyt, P. M. (2016). STARD 2015 guidelines for reporting diagnostic accuracy studies: explanation and elaboration. BMJ open, 6(11), e012799. https://doi.org/10.1136/bmjopen-2016-012799
R Core Team (2020). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. URL: https://www.R-project.org/.
Kuhn M (2020). caret: Classification and Regression Training. R package version 6.0-86, URL: https://CRAN.R-project.org/package=caret.
Nunes MSwcfT, Heuer C, Marshall J, Sanchez J, Thornton R, Reiczigel J, Robison-Cox J, Sebastiani P, Solymos P, Yoshida K, Jones G, Pirikahu S, Firestone S, Kyle R, Popp J, Jay M, Reynard. C (2020). epiR: Tools for the Analysis of Epidemiological Data. R package version 1.0-14, URL: https://CRAN.R-project.org/package=epiR.
Sachs, Lothar. 2006. Angewandte Statistik - Anwendung Statistischer Methode. Berlin Heidelberg New York: Springer-Verlag.