Kennwerte für die Qualität diagnostischer Tests

Speziell in diagnostischen Studien werden die Ergebnisse in Vierfeldertafeln dargestellt, um die Ergebnisse zusammenzufassen gibt es verschiedene Kennzahlen und Testgütekriterien. In den STARD guidelines (2015) wird vorgeschlagen folgende Kennwerte in diagnostischen Studien zu berichten: Genauigkeit, Sensitivität, Spezifität sowie positiver und negativer prädiktiver Wert.

In einer Vierfeldertafel kann ein diagnostischer Test vier Ergebnisse haben:

  1. Das Ergebnis ist positiv, und der Patient hat die Krankheit (true positive).
  2. Der Test ist negativ, aber der Patient hat die Krankheit (false negative).
  3. Der Test ist positiv, aber der Patient hat die Krankheit nicht (false positive).
  4. Der Test ist negativ, und der Patient hat die Krankheit nicht (true negative).

Allgemeine Darstellung einer Vierfeldertafel (2x2 Kreuztabelle) zum diagnostischen Test.

Testergebnis/Diagnose Krank nicht Krank Summe
T+ a b \(a-b\)
T- c d \(c+d\)
Summe \(a+c\) \(b+d\) \(a+b+c+d=n\)

Wichtige diagnostische Testgütekriterien sind in folgender Tabelle aufgelistet die Formeln stammen aus (Sachs 2006) Seite 155.

Begriff English Bezeichnung Berechnung
Sensitivität (TPR) sensitivity Richtig-positiv-Rate, Empfindlichkeit oder Trefferquote \(tpr = \frac{a}{a+c}\)
Spezifität (TNR) specificity Richtig-negativ-Rate \(tnr = \frac{d}{b+d}\)
Positiver prädiktiver Wert (PPV) precision or positive predictive value Wahrscheinlichkeit, dass ein Patient mit positivem Testergebnis tatsächlich krank ist \(ppv = \frac{tpr \cdot pre}{tpr \cdot pre + (1-tnr) \cdot (1-pre))} = \frac{a}{a+b}\)
Negativer prädiktiver Wert (NPV) negative predictive value Wahrscheinlichkeit, dass ein Patient mit negativem Testergebnis tatsächlich gesund ist \(npv = \frac{tnr \cdot (1-pre)}{(1-tpr)*pre) + (tnr) \cdot (1-pre)} = \frac{d}{c+d}\)
Genauigkeit (ACC) Accuracy Prätestwahrscheinlichkeiten vor dem Test gesund bzw. krank zu sein \(acc=\frac{a+d}{n}\)
Prävalenz (PRE) Prevalence Schätzwert für den Anteil an Erkrankter in der Grundgesamtheit (nur aussagekräftig bei einer sehr großen Stichprobe) \(pre = \frac{a+c}{n}\)

Beispiel

Hier ein fiktives Beispiel, Inspiration ist das Beispiel aus (Bortz 2010) Seite 261. Ein neu entwickelter Schnelltest für die Virale Infektionskrankheit X soll überprüft werden. Goldstandard für die Identifikation der Infektion ist ein PCR-Tests der Fragmente des Virengenoms nachweist. Bei einem positiven Befund dieser ein zweites mal durchgeführt, dadurch ist die Methode zeitaufwendig und teuer. Beim Schnelltest werden die gebildeten Antikörper des Körper des Patienten getestet, was mit einem speziell beschichteten Papierstreifen erfolgt.

Untersucht wurden 187 Patienten generelle Symptome wie Fieber und Atemprobleme aufweisen, die auf eine Infektion durch den Virus X hindeuten.

Tab 1: 2x2 Tabelle zur Bestimmung der Kennwerte
  GoldStandart
Schnell.Test   positiv negativ Sum
positiv    111 2 113
negativ    12 62 74
Sum    123 64 187

In der Tabelle 2 sind die Kennzahlen Aufgelistet. Aus Sicht des Arztes ist der positive Vorhersagewert (PPV) besonders von Interesse. Der PPV gibt die Sicherheit an mit welcher Wahrscheinlichkeit bei einer positiven Testergebnis die Krankheit vorliegt. Wenn also der Test positiv mit der neuen Methode vorliegt beträgt die Wahrscheinlichkeit, dass die Infektion vorliegt 98.2 %.

Analog ist der negative Vorhersagewert (NPV) definiert. Er gibt den Anteil an nicht erkrankten Patienten bei einem negativen Testergebnis an. Hier im Beispiel mit 83.8 % kann man relativ sicher sein wenn der Test negativ ist, nicht erkrankt zu sein.

Sensitivität (TPR) und Spezifität (TNR) müssen immer gemeinsam betrachtet werden und beide müssen hoch sein. Wobei hoch immer vom Kontext abhängt. Ist eine Krankheit lebensbedrohlich ist eine hohe Sensitivität des Tests wünschenswert. Wenn hingegen keine Therapie bekannt ist oder Nachfolgeuntersuchungen mit einem erheblichen Risiko für den Patienten verbunden sind sollte die Spezifität des Tests möglichst hoch sein. Hier im Beispiel sind die Werte für Sensitivität 90.2 % und für Spezifität 96.9 %.

Tab 2: Point estimates and 95 % CIs:
Diagnostic.Parameters Point.Estimates
Apparent prevalence 0.60 (0.53, 0.67)
True prevalence 0.66 (0.58, 0.73)
Sensitivity 0.90 (0.84, 0.95)
Specificity 0.97 (0.89, 1.00)
Positive predictive value 0.98 (0.94, 1.00)
Negative predictive value 0.84 (0.73, 0.91)
Diagnostic Accuracy 0.93 (0.88, 0.17)

Ist nun aber die Prävalenz aus der Literatur bekannt - hier im Beispiel für die Infektionskrankheit X wird 1 % angenommen, ergibt sich für die positiven Vorhersagewerte ein anderes Bild. Der für den Patienten so wichtige PPV sinkt im Beispiel auf 22.6 %. Mit anderen Worten der positive Vorhersagewert ist nicht zu ermitteln wenn der Anteil an Infektionen in der Referenzpopulation unbekannt ist.

Tab 3: Geschätzte prädektive Werte mit verschiedener Prävalenz
Parameter Prävalenz aus den Daten geschätzt Prävalenz bekannt
Prevalence 0.658 0.01
Sensitivity 0.902 0.902
Specificity 0.969 0.969
Pos Pred Value 0.982 0.226
Neg Pred Value 0.838 0.999

Literatur

STARD (2015) Cohen, J. F., Korevaar, D. A., Altman, D. G., Bruns, D. E., Gatsonis, C. A., Hooft, L., Irwig, L., Levine, D., Reitsma, J. B., de Vet, H. C., & Bossuyt, P. M. (2016). STARD 2015 guidelines for reporting diagnostic accuracy studies: explanation and elaboration. BMJ open, 6(11), e012799. https://doi.org/10.1136/bmjopen-2016-012799

R Core Team (2020). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. URL: https://www.R-project.org/.

Kuhn M (2020). caret: Classification and Regression Training. R package version 6.0-86, URL: https://CRAN.R-project.org/package=caret.

Nunes MSwcfT, Heuer C, Marshall J, Sanchez J, Thornton R, Reiczigel J, Robison-Cox J, Sebastiani P, Solymos P, Yoshida K, Jones G, Pirikahu S, Firestone S, Kyle R, Popp J, Jay M, Reynard. C (2020). epiR: Tools for the Analysis of Epidemiological Data. R package version 1.0-14, URL: https://CRAN.R-project.org/package=epiR.

Sachs, Lothar. 2006. Angewandte Statistik - Anwendung Statistischer Methode. Berlin Heidelberg New York: Springer-Verlag.