Effektstärke d (Cohens d) einfach berechnen!

Cohens d zeigt dir, wie groß ein gefundener Effekt bei Mittelwertsunterschieden ist. Das wäre z. B. eine Fragestellung wie: "Unterscheiden sich Frauen und Männer in ihrem Shopping-Durchhaltevermögen?". Wenn du diese Studie machen würdest, würdest du zunächst einen t-Test für unabhängige Stichproben durchführen und dann schauen, ob du ein signifikantes Ergebnis erhältst. Anschließend stellt sich dann die Frage, wie groß der gefundene Mittelwertsunterschied zwischen den beiden Gruppen ist und in welche Richtung er geht. Wobei wir hier vermutlich auch ohne Daten so unsere Vermutungen hätten....

Im Folgenden zeige ich dir, wie du (meist nach Durchführung eines Signifikanztests – Stichwort: p-Wert) durch die Berechnung von Cohens d eine Aussage über die praktische Relevanz des gefundenen Effekts machen kannst.

Da es für dieses Effektstärkemaß verschiedene Varianten gibt (man mag es in der Statistik ja gerne etwas kompliziert), dreht sich dieser Artikel ausschließlich um Cohens d zum Unterschied zweier Mittelwerte aus unabhängigen Stichproben. Der Begriff "unabhängige Stichproben" meint, dass bei allen Proband*innen nur einmal der interessierende Wert erhoben wurde.

icon-logo-statistik

Was sind Effektstärken?

Effektstärken bzw. Effektstärkemaße zeigen, wie stark ein in einer Studie beobachteter Effekt ist.

Je nach Inhalt der Untersuchung verwendet man unterschiedliche Effektstärkemaße. Diese werden in zwei Gruppen eingeteilt: Abstandsmaße und Zusammenhangsmaße.

Erstere zeigen meist die Größe der Abstände zweier Mittelwerte in Standardabweichungs-Einheiten an, während Letztere gewöhnlich Variationen des Korrelationskoeffizienten r nach Bravais-Pearson sind. Schickerweise lassen sich beide Gruppen ineinander überführen!

In welchen Bereich der Statistik gehören sie?

Die Effektstärken gehören in die Welt der schließenden oder Inferenzstatistik, können jedoch auch deskriptivstatisch verwendet werden – also nur zur Beschreibung dessen, was bei bestimmten Stichproben vorgefunden wird, ohne auf die dazugehörige Grundgesamtheit schließen zu wollen.

Im Bereich der Inferenzstatistik sollten sie zusätzlich zur Angabe des Ergebnisses eines Signifikanztests mit angegeben werden.

Was sagt Cohens d aus?

Cohens d ist eines der am häufigsten in der Statistik verwendeten Effektstärkemaße und beschreibt, wie stark sich die Mittelwerte zweier Stichproben unterscheiden.

Da Cohens d ein standardisiertes Abstandsmaß ist, ist es unerheblich, mit welchen Messinstrumenten die abhängige Variable erhoben wurde. Denn durch die Standardisierung werden evtl. mit verschiedenen Messinstrumenten gemessene Mittelwerte auf eine neue, gemeinsame dimensionslose Einheit gebracht und dadurch direkt vergleichbar.

Ein weiterer Vorteil ist, dass Cohens d im Gegensatz zum p-Wert nicht von der Stichprobengröße abhängt.

Grafisch dargestellt bedeutet der Mittelwertsunterschied, wie weit die beiden Mittelwerte auf der x-Achse auseinander liegen. Je näher, desto kleiner d – und je weiter auseinander, desto größer d und somit der gefundene Effekt.

Guckst du – hier liegen die Mittelwerte relativ weit auseinander, so dass ein mittlerer bis großer Effekt vorliegt. Ob dieser Effekt groß genug ist, um statistisch signifikant zu sein, muss man jedoch berechnen.

cohens-d
icon-logo-statistik

Berechnung Cohens d

Hier ist die Formel, um den standardisierten Mittelwertsunterschied bei zwei unabhängigen Stichproben zu berechnen.

Wir machen das jetzt zur oben erwähnten Fragestellung zum Unterschied des Shopping-Durchhaltevermögens von Frauen und Männern. Das Shopping-Durchhaltevermögen wird auf einer Skala von 0 (= gar nicht vorhanden) bis 100 (= stolze*r Preisträger*in der platinfarbenen Einkaufstasche) erhoben.

Die unten abgebildete Formel besteht im Zähler aus dem Abstand zwischen den beiden Mittelwerten, der dann anhand der gemeinsamen Streuung im Nenner relativiert und somit standardisiert wird. Da gewöhnlich von Stichproben-Mittelwerten ("x quer") auf die Erwartungswerte in der Population ("mü") geschlossen wird, verwendet man in der Praxis den zweiten, rechten Teil der Formel:

formel-cohens-d

Angenommen, wir hätten aus unseren Daten Folgendes errechnet:

- für die Frauen (Gruppe A) einen Mittelwert von 65.3 mit einer Standardabweichung von 4.5 

- für die Männer (Gruppe B) einen Mittelwert von 59.6 mit einer Standardabweichung von 3.9 

Die Mittelwerte für den Zähler haben wir nun schon, jetzt fehlt uns nur noch die gemeinsame Streuung für den Nenner. Dafür gibt es zwei Varianten:

Wenn die Stichprobengröße bei beiden Gruppen gleich ist, verwendest du die folgende Formel für die Berechnung der gemeinsamen Streuung:

formel-streuung-cohens-d

Wenn wir beispielsweise eine Stichprobengröße von 60 Personen in beiden Stichproben (= gleiche Anzahl von Personen in jeder Gruppe) haben, sieht die obige Formel nun so aus:

beispiel-cohens-d

Jetzt können wir alle Werte in die oberste Gleichung einsetzen und erhalten d:

ergebnis-cohens-d-1

Gemäß den Konventionen von Cohen (s. u.) wäre das ein ausgesprochen starker und praktisch bedeutsamer Mittelwertsunterschied!

icon-logo-statistik

Ist hingegen die Stichprobengröße ungleich, nimmst du diese schöne Formel für die gemeinsame Streuung:

formel-cohens-d-streuung

Bei Stichprobengrößen von 58 Frauen (Gruppe A) und 51 Männern (Gruppe B) sieht das dann so aus:

streuung-cohens-d-ungleich

In die Ursprungsformel eingesetzt:

cohens-d-ungleich

FAZIT:

In diesem Fall bleibt die Aussage gleich, da sich durch die unterschiedlichen Stichprobengrößen nichts verändert hat (dies ist jedoch nicht immer so).

Es liegt hier also ein ausgesprochen starker Mittelwertsunterschied vor, d. h. Männer und Frauen unterscheiden sich sehr stark in ihrem Shopping-Durchhaltevermögen (wer hätte das gedacht!). Die Frauen sind um 1.35 Standardabweichungen durchhaltefähiger als die Männer!

icon-logo-statistik

Konventionen für die Interpretation

Praktischerweise gibt es für die Interpretation der Mittelwertsunterschiede von J. Cohen (1988) vorgeschlagene Konventionen, welche als grober Anhaltspunkt zu verstehen sind:

  • |d| = 0.2  kleiner Effekt
  • |d| = 0.5  mittlerer Effekt
  • |d| = 0.8  großer Effekt

Die Striche um das d herum sind Betragstriche, was bedeutet, dass der Wert z. B. –0.2 oder +0.2 sein kann. Cohens d kann bei einem Mittelwertsunterschied, der nicht in die erwartete Richtung geht, also auch negativ werden.

Da es sich hierbei um Konventionen bzw. Orientierungspunkte handelt, sollte man die in einem Forschungsbereich typischen Effekte bei der Interpretation mit einbeziehen. Schau' dir also vor der finalen Einschätzung des Stärkegrades des gefundenen Effekts verschiedenen Studien zu deinem Thema an, um ein Gefühl dafür zu bekommen, was in dem jeweiligen Feld als "großer", "mittlerer" oder "kleiner" Effekt bezeichnet werden kann.

icon-logo-statistik

Cohens d mit SPSS & Online-Rechnern

An dieser Stelle habe ich eine schlechte und eine gute Nachricht für dich. Die schlechte zuerst:

SPSS spuckt d leider nicht direkt aus. Knurr.

Und jetzt die gute:

Dafür gibt's Psychometrica, eine wunderbare und sehr hilfreiche Seite zur Berechnung diverser statistischer Kennzahlen.

Nun Zum Abschluss noch ein Steckbrief:

icon-logo-statistik

Steckbrief Cohens d

  • Abstandsmaß für die Stärke/Größe von Mittelwertsunterschieden
  • Drückt den Unterschied in Standardabweichungs-Einheiten aus
  • Daher auch geeignet für abhängige Variablen, die mit verschiedenen Messinstrumenten erhoben wurden
  • Aufgrund der Berechnung von Mittelwerten nur bei metrischen Skalen anwendbar!
  • Cohens Konventionen zur Stärke des Effekts sind nur als grobe Richtlinie zu verstehen – wichtig, immer die im jeweiligen Forschungsbereich "typischen" Effekte zu recherchieren 
  • Kann nicht direkt mit SPSS, wohl aber mit Online-Rechnern wie Psychometrica oder der Freeware G*Power berechnet werden

Quellen:

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed). Hillsdale, N.J: L. Erlbaum Associates.

Ellis, P. D. (2010). The Essential Guide to Effect Sizes: Statistical Power, Meta-Analysis, and the Interpretation of Research Results. Cambridge: Cambridge University Press.

Field, A. (2018). Discovering Statistics using IBM SPSS Statistics. London: SAGE.

Sedlmeier, P., & Renkewitz, F. (2018). Forschungsmethoden und Statistik für Psychologen und Sozialwissenschaftler. München: Pearson.

icon-logo-statistik
Probleme beim lernen von Statistik?
Wie wär's mit Lern-Tipps & einer Liste der besten Ressourcen?

Schnapp' dir dein gratis E-Book und werd' zum Statistik-Crack!

icon-logo-statistik

Geschafft – Respekt!

So viel für heute – die Darstellungen weiterer Effektstärkemaße folgen in weiteren Posts. 

Wenn du einen Beispiel-Datensatz zur Hand hast (z. B. von Andy Field), dann versuch' dich doch gleich mal an der Berechnung von d und überprüf' deine Ergebnisse bei Psychometrica!

Und jetzt: fette Belohnen!

Statistik ist ja gemeinhin nicht das allerflauschigste Fach.

Also sollten wir es uns zumindest beim und nach dem Lernen gut gehen lassen...

belohnung-effektstaerke
>