Effektstärke
Effektstärke ist eine dimensionslose Zahl zur Verdeutlichung der praktischen Relevanz von statistisch signifikanten Ergebnisse. Es gibt zwei Arten von Effekten (standardisierten) Effektstärken die d-Familie, die Unterschiede zwischen Gruppen betrachtet, und die r-Familie, welche ein Maß für Zusammenhänge zwischen Daten ist Hemmerich (n.d.). Unstandardisierte Effektgrößen sind Differenzen von Gruppenmittelwerten (raw mean difference) und unstandardisierte Regressionskoeffizienten. Der p-Wert ist keine Effektstärke.
Kreuztabelle: Cohen’s w, \(\phi\), Cramer’s V, C
ANOVA/Regression: f, \(\eta\), \(\eta_{part}\) und d, \(\Delta\), Hedge’s g (bei Vergleich der Stichproben) sowie Odds Ratio, Risk Ratio, r, R
Oft wird in wissenschaftlichen Arbeiten gefordert das Eta-Quadrat zu berichten. Das Eta-Quadrat ist nur eine Variante von Maßzahlen zur Effektstärke und nicht die Effektstärke und nicht immer ist das Eta-Quadrat die passende Zahl. Eta-Quadrat hat zudem den prinzipiellen Nachteil, dass es “unanschaulich” ist. Das APA-Manual schreibt dazu (APA (2009) Seite 34).
… include some measure of effect siz …, whenever possible, provide a confidence interval of each effect size. Effect size may be expressed in the original units (mean, … regression slope). It can be valuable to report Effect size, also in some standardized or unites-free unit, … however, it, to provide the reader enough information to assess the magnitude of the observed effect
Frei interpretiert heißt das; unstandardisierte Effektgrößen (Regressionskoeffizienten mit 95%-CI) müssen angeben werden, andere können angegeben werden. Die “magnitude of the observed effect” ist am besten über die Effectplots darzustellen (???).
Formeln
Pearson-Korrelation r Cohens d
\(r={\frac {d}{{\sqrt {d^{2}+{\frac {(n_{1}+n_{2})^{2}}{n_{1}n_{2}}}}}}}\)
Cohens f2
\(f^{2}={\frac {R_{{included}}^{2}-R_{{excluded}}^{2}}{1-R_{{included}}^{2}}}\)
partielle Eta-Quadrat \(\eta ^{2}={\frac {QS_{{{\rm {Effekt}}}}}{QS_{{{\rm {Effekt}}}}+QS_{{{{\rm {Res}}}}}}}\)
Referenzwerte der Effektstärke
Referenzwerte (Daumenwerte) von Cohen, abgewandelt nach Ellis (2010). Quelle: https://matheguru.com/stochastik/effektstarke.html
Test | Effektmaß | Klein | Mittel | Groß |
---|---|---|---|---|
Vergleich zweier unabhängiger Stichproben | d, Δ, Hedge’s g | 0.20 | 0.50 | 0.80 |
Vergleich von zwei Korrelationen | q | 0.1 | 0.3 | 0.5 |
Korrelationskoeffizient | r | 0.10 | 0.30 | 0.50 |
Determinationskoeffizient | r² | 0.01 | 0.09 | 0.25 |
Kreuztabelle | Cohen’s w, φ, Cramer’s V, C | 0.10 | 0.30 | 0.50 |
ANOVA | f | 0.1 | 0.25 | 0.4 |
. | η²part | 0.01 | 0.06 | 0.14 |
Multiple Regression | R² | 0.02 | 0.13 | 0.26 |
. | Cohen’s f² | 0.02 | 0.15 | 0.35 |
Hier zum Vergleich die Referenzwerte mit dem package ‘pwr’ von Stephane Champely (2018)
Tab 1: Referenzwerte der Effektstärk | |||
Test | small | medium | large |
---|---|---|---|
p | 0.2 | 0.5 | 0.8 |
t | 0.2 | 0.5 | 0.8 |
r | 0.1 | 0.3 | 0.5 |
anov | 0.1 | 0.25 | 0.4 |
chisq | 0.1 | 0.3 | 0.5 |
f2 | 0.02 | 0.15 | 0.35 |
Anmerkung: Für die logistische Regression gibt Backhaus einen Wert des Nagelkerke - R² mit 0.50 als gut interpretierbar an. Es wird angegeben das das Pseudo R-Quadrat vergleichbar mit dem linearen Bestimtheitsmaß ist.
Literatur
APA. 2009. Publication Manual of the American Psychological Association, 6th Edition -. Edited by American Psychological Association. Redmond, Washington: Best Sellers.
Hemmerich, W. A. n.d. “Effektstärke.” MatheGuru. Accessed March 7, 2019. /stochastik/effektstarke.html.