Lineare Regression

Die Bezeichnung Regression stammte historisch gesehen von Francis Galton, er untersuchte den Zusammenhang der Körpergröße von Eltern und Kindern (Regression to the Mean). Ziel der Regressionsanalyse ist eine funktionale Beziehung zwischen zwei Größen zu finden.[1] Mathematisch lässt sich das folgend formulieren \(Y = a + b*X + e\), dabei ist \(X\) die unabhängige und \(Y\) die abhängige Variable und \(e\) der statistische Fehler. Gesucht wird, die Formel (Funktion der Gerade), die in der graphischen Darstellung durch den Mittelwert verläuft. Die Regression ist quasi die Erweiterung der Korrelationsanalyse die ja die Stärke des Zusammenhangs ermittelt.

Die Berechnung kann mit allen gängigen Statistik-Programmen durchführt werden. Auf der Seite der University of Basel (Department of Chemistry) findet sich sogar ein sehr schöner Onlinerechner für Regressionen von Hanspeter Huber. Dort findet man, gut aufbereitet die wichtigsten Formel für die Berechnung.

Beispiel

Hier ein kleines Besipiel aus Bühl (2014) Seite 354 (Datensatz Harnblasenkarzinom). Untersucht werden soll, ob es einen Unterschied in den Gruppen Krank/Gesund hinsichtlich der T-Zelltypisierung gibt. Der Mittelwert der T-Zelltypisierung liegt bei 67.31 (SD 6.41, range 48.50 to 78.50). Aus der Abbildung 1 ist deskriptiv ableitbar, dass kranke Probanden geringere Messwerte aufweisen. Die lineare Regressionsanalyse zeigt, dass das Modell als Ganzes R2=.34, ad.R2=.33, F(1, 43)=22.19, p<.001 als auch die T-Zelltypisierung signifikant ist. Die Gruppe der Gesunden Patienten zeigen einen höheren Wert bei der T-Zelltypisierung. (Sachs 2006)

Boxplot Verteilung der T-Zelltypisierung in den zwei Gruppen Krank/Gesund

Figure 1: Boxplot Verteilung der T-Zelltypisierung in den zwei Gruppen Krank/Gesund

Tab 1: Regressionsanalyse
Quelle b conf
Parameter
(Intercept) 63.9*** [ 66, 61.7]
gruppegesund 7.41*** [10.6, 4.24]
Goodness of fit
r.squared 0.34
adj.r.squared 0.33
AIC 281.18
BIC 286.60
RMSE 5.15
Obs 45

Literatur

Bühl, Achim. 2014. SPSS 22 : Einführung in Die Moderne Datenanalyse -. München: Pearson.

Sachs, Lothar. 2006. Angewandte Statistik - Anwendung Statistischer Methode. Berlin Heidelberg New York: Springer-Verlag.