Analyse von wiederholten Messungen

Viele Studienansätze liefern wiederholte Messungen eines bestimmten Merkmals an verschiedenen Zeitpunkten. Die Auswertung und Berechnung mit SPSS gelingt einem meist irgendwie, aber spätestens der Output wird für erstmalige SPSS- Anwender kaum zu deuten sein (Bühl (2014), S 409). Hier gibt es Multivariate Tests, Test der Innersubjekteffekte, Tests der Zwischensubjekteffekte usw. und überall gibt es signifikante Werte.

Um all die Tabellen zu deuten bedarf es eines statistischen Hintergrundwissens daher beschreibe ich hier ein fiktives Beispiel für eine Datenreihe mit Messwiederholung.

Die Messwerte sind die Beobachtung von zwei Patienten-Gruppen Kontrollgruppe und Untersuchungsgruppe. Bei den Patienten handelt es sich um Intensivpatienten, beim Messwert um die Restmenge an Mageninhalt der über die Zeit beobachtet wird.

Profildiagramm zu den Daten im Beispiel

Figure 1: Profildiagramm zu den Daten im Beispiel

Bei der Betrachtung von Messwiederholungen sind zwei wesentliche Eigenschaften von Interesse der Gipfelwert und das Wachstum. In der Abbildung wird deutlich, dass die Patientengruppe mit der Therapie einen andern Verlauf in der Restmenge aufweist als die Kontrollgruppe. Start und Endwert sind nicht sehr unterschiedlich, das Maximum ist deutlich unterschiedlich und bei der Kontrollgruppe zeigt sich ein deutlich ausgeprägter Gipfelwert.

Auswerten mit Excel

Der Verlauf eines Gipfelwerts lässt sich bereits mit MS-Excel auswerten. Mit den Bordmitteln von Excel lassen sich Minimum, Maximum, Regressionskoefizienten und AUC (Fläche unter der Kurve) berechnen und mit einem T-Test auf Signifikanz prüfen. Den T-Test gibt es bei Excel über die Analysefunktionen. Das Excel Beispiel dazu habe ich hier . (Die zugrunde liegenden Formeln finden sich bei Sachs (2006) Seite 545).

Aus den vorliegenden Ergebnisse lässt sich ableiten: Der Startwert unterscheidet sich nicht signifikant. er Maximalwert(p=0,007) und die Fläche (p=0,032) unter der Kurve sind signifikant verschieden. Zum Zeitpunkt der letzten Messung kann aus den Daten kein Unterschied belegt werden.

Tab1: Wiederholte Messung in zwei Gruppen (Untersuchungsgruppe mit Therapie Kontrollgruppe ohne Therapie) zu 5 verschiedenen Zeitpunkten angegeben. In der Tabelle sind Mittelwerte, T-Wert und Signifikanz. Auswertung mit MS- Excel

Quelle Therapie Ja Therapie Nein T-Wert p-Wert
Max 569 843 -2,88 0,007
AUC 1451 1897 -2,22 0,032
REGR -62 -30 -1,22 0,230
Startwert 446 547 -1,11 0,273
Endwert 199 293 -1,56 0,125

Als erste Betrachtung ist diese Auswertung mit Excel durchaus hinreichend für weitergehende Analysen ist es notwendig sich genauer Gedanken über Verteilung der Daten und der zugrunde liegenden Hypothesen zu machen.

Auswerten mit SPSS

Der traditionelle Ansatz für die Analyse von Messwiederholungen ist die Varianzanalyse (ANOVA) die drei spezielle Fragestellungen prüft: die Wechselwirkung zwischen den Gruppen und der Zeit, der Effekt durch den Studienfaktor und der Effekt durch die Wiederholung (Zeit). Mit MS-Excel ist eine solche Auswertung schon recht aufwändig, daher ist es besser mit einer Statistik-Software weiterzuarbeiten.

Wichtige Voraussetzung ist, das die Messwerte angenähert der Normalverteilung entsprechen und das die so genannte Sphärizität gegeben ist (Sphärizität bedeutet das die Differenzen zwischen den Faktorstufen gleich sind). Weiter muss man sich Gedanken über das zugrunde liegende Modell machen (Modell I für feste Effekte, Modell II für zufällige Effekte oder Modell III für gemischte Effekte). Wenn die Daten mit SPSS ausgewertet werden, braucht man sich scheinbar um die zugrunde liegenden Modelle und Voraussetzungen keine Gedanken zu machen. Da SPSS standardmäßig alles berechnet was eventuell von Nutzen sein könnte und es dem kundigen Nutzer überlässt die relevanten Zahlen zu finden.

Zunächst wird eine Berechnung zum Faktor Zeit und zu den Wechselwirkungen ausgegeben (Multivariate Tests – Methode des allgemeinen linearen Modells) dabei gilt die “Pillai-Spur” als robustester Test. Es wird ein höchst signifikanter Einfluss der Zeit Festgestellt, die Wechselwirkung mit der Zeit ist hingegen nicht signifikant (Zeit p<0,0001 Zeit:Therapie p=0,385). Es folgt der Mauchly-Test auf Sphärizität, er prüft ob die Voraussetzung der Sphärizität gegeben sind. In unserem Beispiel ist der Wert Signifikant (p<0,0001) das bedeutet die Voraussetzung ist nicht gegeben. Daher werden die Ergebnisse in der Tabelle “Tests der Innersubjekteffekte” (Methode nach Fischer) die Zeile “Greenhouse-Geisser” entnommen. Es ergeben sich ähnliche Ergebnisse wie bei der “Pillai-Spur” (Zeit p<0,0001 Zeit:Therapie p=0,263). Es folgt die Berechnung der Nicht-Messwiederholungsfaktoren (Tests der Zwischensubjekteffekte). Es ergibt sich ein nicht signifikanter Einfluss der Therapie (p=0,073). Bühl (2014)

Tab2: Multivariate Tests

Effekt Wert F Hypothese df Fehler df Signifikanz
Zeit Pillai-Spur 0,411 7,3 4 42
Wilks-Lambda 0,589 7,3 4 42 0,000
Hotelling-Spur 0,699 7,3 4 42 0,000
Größte char Wurzel nach Roy 0,699 7,3 4 42 0,000
Zeit* Therapie Pillai-Spur 0,092 1,1 4 42
Wilks-Lambda 0,908 1,1 4 42 0,385
Hotelling-Spur 0,102 1,1 4 42 0,385
Größte char Wurzel nach Roy 0,102 1,1 4 42 0,385

Tab3: Mauchly-Test auf Sphärizität prüft ob die Voraussetzung der Sphärizität gegeben ist.

Innersubjekteffekt Mauchly-W Chi-Quadrat df Signifikanz
ZEIT 0,298 53 9 0,000

Tab4: Tests der Innersubjekteffekte

Quelle Quadratsumme vom Typ II df Mittel der Quadrate F Signifikanz
Zeit Sphärizität angenommen 2526380 4,0 631595 7,9
Greenhouse-Geisser 2526380 3,1 825275 7,9 0,000
Huynh-Feldt 2526380 3,4 746785 7,9 0,000
Untergrenze 2526380 1,0 2526380 7,9 0,007
Zeit* Therapie Sphärizität angenommen 426332 4,0 106583 1,3
Greenhouse-Geisser 426332 3,1 139267 1,3 0,263
Huynh-Feldt 426332 3,4 126022 1,3 0,261
Untergrenze 426332 1,0 426332 1,3 0,253
Fehler(Zeit) Sphärizität angenommen 14306507 180,0 79481
Greenhouse-Geisser 14306507 137,8 103854
Huynh-Feldt 14306507 152,2 93976
Untergrenze 14306507 45,0 317922

Tab5: Tests der Zwischensubjekteffekte

Quelle Quadratsumme vom Typ II df Mittel der Quadrate F Signifikanz
Intercept 38701552 1 38701552 263,6 0,000
Therapie 493543 1 493543 3,4 0,073
Fehler 6607055 45 146823

Auswerten mit R

Wenn die Auswertung mit R berechnet wird, schaut das Ergebnis kompakter und übersichtlicher aus. Allerdings muss man sich vorher Gedanken machen, welche Zusammenhänge wichtig sind. Eine gute Anleitung dazu gibt es hier R and Analysis of Variance und hier Katholieke Universiteit Leuven, weiterführende Aspekte (Post-Hoc Tests) beschreibt Paul Gribble in seinem Blogbeitrag Repeated Measures ANOVA using R.

Ich habe den traditionellen Ansatz mit einem F-Test gewählt den R-Code dazu gibt es hier zum Ausprobieren dabei habe ich mich weitgehend an Sachs (2006) Seite 543 bis 547 angelehnt. Die Berechnungen sind identisch mit denen von SPSS da die gleichen Rechenschritte zugrunde liegen, der Einfluss der Zeit ist signifikant (p<0,0001) die Wechselwirkung hingegen ist nicht signifikant (p=0,257) und er Einfluss der Therapie ist nicht Signifikant (p=0,073).

Table 1: Regressions-Koeffizient nach Sachs
Therapie Ja Therapie Nein T-Wert p-Wert
Max 569 843 -2.88 0.007
AUC 1451 1897 -2.22 0.032
REGR -62 -30 -1.22 0.230
Startwert 446 547 -1.11 0.273
Endwert 199 293 -1.56 0.125

Regressions-Koeffizient händisch nach dem Kochrezept von Sachs (2006) berechnet.

Table 2: ANOVA für Messwiederholungen
stratum term df sumsq meansq statistic p.value
Proband Therapie 1 493543 493543 3.36 0.073
Proband Residuals 45 6607055 146823 NA NA
Within Zeit 4 2526380 631595 7.95 0.000
Within Therapie:Zeit 4 426332 106583 1.34 0.256
Within Residuals 180 14306507 79481 NA NA

Alternativer für Messwiederholung plus Post Hoc Test. (Entnommen Paul Gribble Repeated Measures ANOVA using R.)

Table 3: Messwiederholungen Post Hoc Test
response term estimate std.error statistic p.value
RMT0 (Intercept) 425 77 5.51 0.000
RMT0 TherapieNein -59 102 -0.58 0.567
RMT1 (Intercept) 446 73 6.11 0.000
RMT1 TherapieNein 101 96 1.04 0.302
RMT2 (Intercept) 416 90 4.64 0.000
RMT2 TherapieNein 209 118 1.76 0.084
RMT3 (Intercept) 277 40 6.99 0.000
RMT3 TherapieNein 118 52 2.25 0.029
RMT4 (Intercept) 199 48 4.11 0.000
RMT4 TherapieNein 95 64 1.48 0.145

Interpretation der Ergebnisse

Die Interpretation der Ergebnisse geht von der Hypothese aus: “Es besteht keine Wechselwirkung zwischen Therapie (Studienfaktor) und der Zeit. Laut den Ergebnissen der Varianzanalyse besteht keine Wechselwirkung mit der Therapie. Im Profildiagramm (Abb. 1) und in der Berechnung der Maximalwerte und der Fläche unter der Kurve (AUC, area under curve) zeichnet sich aber ein messbarer Effekt der Therapie ab. Die Daten im Beispiel zeigen deutlich das manchmal einfachere Methoden besser geeignet sind Daten zu beschreiben.

Literatur

Bühl, Achim. 2014. SPSS 22 : Einführung in Die Moderne Datenanalyse -. München: Pearson.

Sachs, Lothar. 2006. Angewandte Statistik - Anwendung Statistischer Methode. Berlin Heidelberg New York: Springer-Verlag.