Methoden

Lineare Regression

Die Bezeichnung Regression stammte historisch gesehen von Francis Galton, er untersuchte den Zusammenhang der Körpergröße von Eltern und Kindern (Regression to the Mean).Ziel der Regressionsanalyse ist eine funktionale Beziehung zwischen zwei Größen zu finden.[1] Mathematisch lässt sich das folgend formulieren \(Y = a + b*X + e\), dabei ist \(X\) die unabhängige und \(Y\) die abhängige Variable und \(e\) der statistische Fehler.Gesucht wird, die Formel (Funktion der Gerade), die in der graphischen Darstellung durch den Mittelwert verläuft.

Test auf linearen Trend bei relativen Häufigkeiten

Erfolgt eine Zunahme der relativen Häufigkeit in einer Kreuztabelle mit zwei Kategorien gleichmäßig, dann ist unter Umständen der Trend (Anstieg) von besonderen Interesse. Um das zu veranschaulichen, nehme ich wieder mein Beispiel aus dem Beitrag Odds Ratio und relatives Risiko auf. Bei dem die Wirkung des Luftschadstoffs NOx auf eine unspezifische Reizung untersucht wird. Figure 1: Trend bei relativen HäufigkeitenDer Cochran-Armitage Test prüft eine als linear ansteigend gedachte Häufigkeit mit Hilfe der Chi²-Statistik (Sachs (2006) Seite 599).

Nichtlineare Regression

In naturwissenschaftlich- technischen Anwendungen stellt sich oft das Problem, die Beziehungen von zwei Variablen in optimaler Weise zu beschreiben. Wird ein nicht -linearer Zusammenhang vermutet, stehen mehre Verfahren zur Verfügung.Ein Verfahren ist die Annäherung der Funktion durch ein Polynom\(y=a\cdot x^2 + b\cdot x +c\).Mit dem Verfahren lassen sich zwar die Messpunkte gut anpassen, es besteht aber immer die Gefahr, dass die Messpunkte zwar auf der Kurve liegen aber die Kurve nicht den naturwissenschaftlichen Zusammenhang beschreibt.

Ratingskala

Bei Onlinebefragungen sieht man immer häufiger die Ratingskala bei der Merkmalsausprägung, die in eine Rangordnung gebracht werden muss. Die Auswertung solcher Rangreihen hingegen ist eine nicht triviale Angelegenheit. Die ermittelten Rangwerte stellen eine Ordinalskala dar, die einfachste Darstellung kann mit Modalwert (Häufigster Wert) und Medianwert (50% Wert) erfolgen. Um mehr Informationen aus den Daten zu erhalten, sind die Werte der Rangskala in geeigneter Form zu transformieren. Eine Methode ist die Transformation der Rangreihen in die intervallskalierte Merkmale überführt werden.

Kano-Modell

Die Kundenzufriedenheitsanalyse mit der Kano-Methode ist eine leider viel zu wenig beachtete Befragungsmethode.Das Kano-Modell wurde von Noriaki Kano in den 70ern für die Firma Konica (Minolta Kameras) entwickelt. Die Marketingabteilung stellte damals fest, dass Kunden bei einer direkten Befragung nur geringfügige Änderungen am Produkt wünschten. Ein tief greifendes Verständnis der unausgesprochenen Bedürfnisse des Kunden konnte nicht abgeleitet werden.Kano entwickelte daraufhin eine Methode die Wünsche und Erwartungen von Kunden zu erfassen.

Kreuztabelle

Die Untersuchungen von Zusammenhängen zwischen Gruppen (Beruf, Einkommen, oder Geschlecht von Personen) ist eine sehr häufige Fragestellung. Die einfachste Methode zur Veranschaulichung dieser Zusammenhängen ist eine Kreuztabelle (Kontingenztabelle). Für die Beschreibung der systematischen Zusammenhänge existieren verschiedene Zusammenhangsmaße, der bekannteste ist der Chi² -Test. Der Chi² -Test prüft ob ein Merkmal in zwei oder mehren Stichproben identisch verteilt ist. Die dazugehörige Nullhypothese lautet: H0: Der Anteil jeder Merkmalsausprägung ist in beiden Stichproben gleich.

Interpretation von Mittelwerten

Mittelwerte sind eine beliebte Darstellungsart bei Mitarbeiterbefragungen und Evaluationen. In einem fiktiven Beispiel möchte ich etwas näher drauf eingehen. Folgende Situation: In einem kleinem Betrieb, mit 16 Angestellten, der Medizinprodukte herstellt, wurde eine Mitarbeiterbefragung mittels Onlinfragebogen durchgeführt. Die Daten wurden statistisch ausgewertet. Im folgendem sind die Ergebnisse dargelegt. Im Diagramm sind die Mittelwerte der einzelnen Zufriedenheitsskalen im Vergleich der zwei Abteilungen Produktion und Verwaltung dargestellt. Die Werte sind so codiert, je höher der Skalenwert, desto größer die Zufriedenheit.

Mixed-Mode in der Online-Marktforschung

Im Zuge der G.O.R. 07 habe ich ja am Workshop von Holger Geissler D.G.O.F. teilgenommen, hier kommt eine kurze Zusammenfassung. Unter Mixed Mode sind die Variation der Erhebungsmethoden im Zuge einer Messung zu verstehen. Das einfachste Beispiel für Mixed Mode ist ein Reminder in Form einer Postkarte, die man einem Online-Access-Panel Teilnehmer zwecks Erhöhung der Stchprobenausschöpfung zusendet. Aus Anwendersicht ist Mixed Mode also das Mischen verschiedener Befragungsvarianten. Der Grund warum verschiedene Modes verwendet werden, kann eine bessere Repräsentativität (Erreichbarkeit der Zielgruppe) sein oder eine bessere Ökonomie (Kosten Minimieren) oder eine Erhöhung der Validität der Daten.

Exakter Fisher-Test

In der letzten Zeit ist öfter die Frage, nach dem F-Wert und welcher signifikante Wert den der richtige Wert ist, an mich herangetragen worden. Also gleich vorweg, ein F-Wert hat mehr etwas mit Mikrobiologie zu tun als mit Statistik. Es gibt einen F-Test der grob gesagt die Varianzen testet und den Exakter Fisher-Test der wie ein Chi²-Test zu interpretieren ist und eine F-Verteilung … und … und … Man soll sich bloß nicht verwirren lassen “Exakt” ist ein mathematischer Terminus und bedeutet das Gegenteil von Approximativ, also schon bei kleinen Stichprobengrössen richtig (vergl.

Fragebogen gestalten

Um sich die Arbeit des Layoutens eines Fragebogens zu erleichtern gibt es viele Wege. Eine Möglichkeit ist man verwendet Grafstat, ein durchaus mächtiges Tool um Fragebögen (auch Onlineumfragen) zu gestalten und einfache Auswertungen zu erstellen. Oder man verwendet eine Word- Dokumentenvorlage. Eine solche habe ich auf der Seite www.gesis.org gefunden.