Rankingskala (Rangordnung)

Eine Ranking-Skala ist eine Variante der Rating-Skala bei der Merkmalsausprägung in eine Reihenfolge nach Wichtigkeit geordnet werden. Speziell bei Onlinebefragungen werden häufig Rangordnungs-Fragen (Ranking Question) verwendet, da sie hier besonders einfach zu implementieren sind. Die Auswertung solcher Rangreihen hingegen ist eine nicht triviale Angelegenheit. Die ermittelten Rangwerte stellen eine Ordinalskala dar, die einfachste Darstellung kann mit Modalwert (Häufigster Wert) und Medianwert (50% Wert) erfolgen. Um mehr Informationen aus den Daten zu erhalten, sind die Werte der Rangskala in geeigneter Form zu transformieren. Eine Methode ist die Transformation der Rangreihen in die intervallskalierte Merkmale überführt werden. Die Grundidee dieser Methode geht auf Thurstone (1927) nach dem “Law of Categorical Judgement” zurück. Dabei werden die kumulierten Häufigkeiten in Normalverteilte z-Werte übergeführt und aus diesen die intervallskalierten Markmalsausprägungen gebildet. Bortz (2006) Seite 159

Beispiel Rangordnungs Fragen mit LimeSurvey

Beispiel

Zur Veranschaulichung habe ich hier ein fiktives Beispiel. Es handelt von einer Befragung von Kunden eines Supermarktes. Die Kunden werden befragt, welche Art von Lebensmitteln sie bevorzugen: (a) Produkte aus konventioneller Landwirtschaft (Tab. 1) und (b) Produkte aus biologischer Landwirtschaft. Dabei Reihen die Kunden Begriffe die im Zusammengang mit den Produkten stehen nach Wichtigkeit, zu den Kriterien zählen Qualität, Aussehen, Vielfalt, Verfügbarkeit und Preis. Durch die Betrachtung der Häufigkeiten der Rangplätze lässt sich schon gut abschätzen, welcher Begriff an erster Stelle steht, hier ist bei den Produkte aus konventioneller Landwirtschaft der Geschmack an erster Stelle und bei Produkte aus biologischer Landwirtschaft die Qualität.

Tab 1: Produkte aus konventioneller und biologischer Landwirtschaft (N = 30)
Group Item R1 R2 R3 R4 R5 M SD z.score
konventionell Preis 38% (5) 31% (4) 15% (2) 15% (2) . 2.47 1.46 0.31
konventionell Verfuegbarkeit 21% (3) 36% (5) 36% (5) 7% (1) . 2.47 1.13 0.22
konventionell Geschmack 25% (2) 12% (1) 38% (3) 25% (2) . 3.73 1.49 -0.08
konventionell Qualitaet 29% (4) 14% (2) 7% (1) 50% (7) . 2.93 1.44 -0.18
konventionell Vielfalt 9% (1) 27% (3) 36% (4) 27% (3) . 3.40 1.30 -0.27
biologisch Geschmack 46% (6) 38% (5) . 15% (2) . 2.27 1.49 0.49
biologisch Vielfalt 23% (3) 15% (2) 38% (5) 23% (3) . 2.93 1.33 -0.07
biologisch Verfuegbarkeit 20% (2) 10% (1) 50% (5) 20% (2) . 3.47 1.41 -0.12
biologisch Preis 17% (2) 33% (4) 17% (2) 33% (4) . 3.13 1.41 -0.13
biologisch Qualitaet 17% (2) 25% (3) 25% (3) 33% (4) . 3.20 1.37 -0.18
Law of Categorical Judgement

Was sich nicht aus den Häufigkeiten ableitet, ist die Information wie bedeutend der Unterschied unter den Rangplätzen ist. Dafür kann die oben beschriebene Maßzahl angewendet werden. Da es sich um einen z-Transformierten Wert handelt, kann der Wert zum Abschätzen der Wichtigkeit dienen.

Gegenüberstellung biologischer Landwirtschaft mit konventioneller Landwirtschaft

Figure 1: Gegenüberstellung biologischer Landwirtschaft mit konventioneller Landwirtschaft

In diesem Beispiel zeigt sich, dass bei Kunden die Bioprodukte kaufen der Geschmack überdurchschnittlich an erster Stelle steht und das bei Kunden die konventionelle Produkte kaufen, ist der Preis und die Verfügbarkeit an erster Stelle.

Limitation und weiterführende Methoden

Die hier vorgestellte Methode ist mit starken Limitationen behaftet nach Burton 2009 ist das Law of Categorical Judgment mathematisch incorrekt. Eine weitere Limitation ist die Verwendung bei Rangreihen hier wird unterstellt das die Rangplätze wie eine Ordinalskala skaliert ist. Weiterführende Methoden ist das Plackett-Luce-Model.

Auswertung mit der PlackettLuce Library

library(PlackettLuce)
head(items)
##   Geschmack Preis Qualitaet Verfuegbarkeit Vielfalt
## 1         5     1         4              2        3
## 2         5     1         4              2        3
## 3         5     2         4              3        1
## 4         5     1         4              3        2
## 5         5     1         4              3        2
## 6         5     1         4              2        3
head(input)
## [1] "ordering"
R <- as.rankings(items, input)
mod <- PlackettLuce( R )
#coef(mod) 
round(coef(mod, log = FALSE) ,2)
##    1    2    3    4    5 
## 0.25 0.21 0.13 0.20 0.21
round(coef(mod, log = TRUE) ,2)
##     1     2     3     4     5 
##  0.00 -0.17 -0.65 -0.25 -0.17
summary(mod)
## Call: PlackettLuce(rankings = R)
## 
## Coefficients:
##   Estimate Std. Error z value Pr(>|z|)  
## 1   0.0000         NA      NA       NA  
## 2  -0.1675     0.3204  -0.523   0.6011  
## 3  -0.6491     0.3188  -2.036   0.0418 *
## 4  -0.2520     0.3109  -0.811   0.4176  
## 5  -0.1748     0.3141  -0.556   0.5779  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual deviance:  282.24 on 296 degrees of freedom
## AIC:  290.24 
## Number of iterations: 5
Tab 2:
Item R1 R2 R3 R4 R5 M SD z.score pc log.pc
Geschmack 8 6 3 4 0 3.00 1.64 0.24 0.25 0
Preis 7 8 4 6 0 2.80 1.45 0.08 0.21 -0.17
Vielfalt 4 5 9 6 0 3.17 1.32 -0.17 0.21 -0.17
Verfuegbarkeit 5 6 10 3 0 2.97 1.35 0.05 0.2 -0.25
Qualitaet 6 5 4 11 0 3.07 1.39 -0.20 0.13 -0.65

Zusammenfassung

Mittelwert und Median sind die falschen Maßzahlen für Rangreihen, weniger falsch ist der z-Score. Korrekte Ergebnisse liefern der Modalwert und Berechnung mit der PlackettLuce-Methode.

Literatur

Turner H, Kosmidis I, Firth D (2019). PlackettLuce: Plackett-Luce Models for Rankings. R package version 0.2-9, URL: https://CRAN.R-project.org/package=PlackettLuce.

Rosner, Burton S., und Greg Kochanski. „The Law of Categorical Judgment (Corrected) and the Interpretation of Changes in Psychophysical Performance.“ Psychological Review, Bd. 116, Nr. 1, 2009, S. 116–28. Crossref, doi:10.1037/a0014463.