Dichtefunktion einfach erklärt!

dichtefunktion

In der Psychologie und den meisten Sozialwissenschaften können wir immer nur Stichproben aus der interessierenden Grundgesamtheit ziehen und so gut wie nie alle in Betracht kommenden Personen befragen/testen/beobachten. Daher müssen wir uns mit den Ergebnissen aus einer Stichprobe begnügen und von diesen auf die dazugehörige Grundgesamtheit schließen. 

Um das tun zu können, gibt es verschiedene Vorstellungen davon, wie Variablen wie z. B. Neugier, Offenheit für neue Erfahrungen oder Resilienz verteilt sein könnten, d. h. in welchem Bereich sich wohl die meisten Werte tummeln und wie wahrscheinlich es ist, dass eine Person aus der betreffenden Grundgesamtheit einen Wert hat, der in ein bestimmtes Intervall fällt.

Und genau dafür gibt es die Dichtefunktion: sie ist eine visuelle Darstellung der Auftretenswahrscheinlichkeiten von bestimmten Ausprägungen einer Variablen.

icon-logo-statistik

Was ist eine Dichtefunktion?

Zunächst ein Beispiel: Angenommen, dich interessiert die Kompromissfähigkeit bei gewaltbereiten Jugendlichen auf einer Skala von 0 (= gar nicht vorhanden) bis 100 (= super stark ausgeprägt). Damit hättest du eine stetige, metrische Variable (auf Intervallskalenniveau).

"Stetig" bedeutet, dass zwischen zwei Merkmalsausprägungen THEORETISCH unendlich viele Werte liegen können, wenn man nur genau genug messen würde. Merk' dir vielleicht einfach, dass du bei stetigen Variablen potenziell immer ein Komma und unendlich viele Nachkomma-Stellen anhängen könntest. Also bei der Kompromissfähigkeit so was wie: 48,897120823546043745654...

Nun möchtest du womöglich wissen, wo sich die meisten Werte herumtreiben und wie wahrscheinlich es ist, dass ein Jugendlicher z. B. eine Kompromissfähigkeit zwischen 35 und 40 aufweist. Ersteres kannst du in der Dichtefunktion SEHEN, Letzteres mit der Verteilungsfunktion BERECHNEN.

Eine Dichtefunktion oder Wahrscheinlichkeitsdichte ist eine schicke visuelle Darstellung der Verteilung von stetigen Variablen. Sie zeigt dir, wie und wo sich die einzelnen Merkmalsausprägungen auf einer Skala verteilen und in welchem Bereich die meisten Werte auftreten.

Dort, wo sich die meisten Werte ballen, besteht auch die höchste Wahrscheinlichkeit dafür, dass eine zur interessierenden Grundgesamtheit gehörige (z. B. gewaltbereite Jugendliche), zufällig ausgewählte Person hier ihre Ausprägung hat. Bei der Normalverteilung ist das um den Mittelwert herum. 

Hier siehst du die Dichtefunktion einer Normalverteilung zum Kompromissfähigkeits-Beispiel mit einem Mittelwert von 35 und einer Standardabweichung von 8. Der Bereich +/– eine Standardabweichung ist blau markiert – dort finden sich die meisten Werte. Daher ist auch die Wahrscheinlichkeit am höchsten, dass ein zufällig ausgewählter gewaltbereiter Jugendlicher hier seinen Wert hat, nämlich zwischen 27 und 43.

dichtefunktion-normalverteilung
icon-logo-statistik

In welchen Bereich der Statistik gehört sie?

Die Dichtefunktion gehört in die Welt der Inferenzstatistik und dort in den Bereich des theoretischen Grundwissens.

Dieses Wissen brauchst du, um zu verstehen, wie die verschiedenen Verteilungen zustande kommen (z. B. t oder F), was man mit ihnen machen kann und wie man Wahrscheinlichkeiten berechnet.

icon-logo-statistik

Wie entsteht die Dichtefunktion?

Stell' dir vor, man würde zur Kompromissfähigkeit von gewaltbereiten Jugendlichen unendlich viele Untersuchungen machen und immer wieder Stichproben aus derselben Population ziehen. 

Wenn man dann bei jeder dieser Untersuchungen z. B. den Mittelwert berechnen und diesen auf der oben genannten Skala zwischen 0 und 100 mit einem Strich aufzeichnen würde, bekäme man (sehr vereinfacht gesagt) mit der Zeit aus ganz, ganz vielen Strichen eine Fläche. Dort, wo die Werte besonders oft hinfallen, wo also Ballungen entstehen, häufen sich die Striche, werden länger und es entsteht eine Art Hügel oder Kurve.

Diese Kurve bzw. Dichtefunktion zeigt nun, an welcher Stelle sich die meisten Werte ansammeln und wie wahrscheinlich Merkmalsausprägungen in bestimmten Bereichen sind. Wo die Kurve am höchsten ist, ist auch die Wahrscheinlichkeit am höchsten, dass jemand dort seine Merkmalsausprägung hat.

Die Dichtefunktion muss jedoch nicht immer wie Schlange-frisst-Elefant aussehen.

Hier siehst du ein Beispiel der Dichtefunktion einer F-Verteilung – das ist die Verteilung, die du z. B. für die Varianzanalyse und Regression brauchst:

dichtefunktion-f-verteilung
icon-logo-statistik

Eigenschaften der Dichtefunktion

  • Die Dichtefunktion ist eine sog. Wahrscheinlichkeitsdichte und kann genauso wie Wahrscheinlichkeiten nur positive Werte annehmen. Diese liegen immer zwischen 0 und 1 (das erste Axiom der Wahrscheinlichkeit). 
  • Das bedeutet, dass die Gesamtfläche unter der Kurve immer den Wert p = 1 oder 100% hat (p steht für Wahrscheinlichkeit).
  • Anders ausgedrückt: die Wahrscheinlichkeit dafür, in einer Stichprobe einen Wert zu erheben, der IRGENDWO in dem Bereich unterhalb der Kurve liegt, ist 100% oder 1.
  • Die Wahrscheinlichkeit dafür, dass ein Wert in einen bestimmten Bereich unterhalb der Kurve fällt, also in ein bestimmtes Intervall, liegt irgendwo zwischen 0 und 1. Dies lässt sich dann mit der Verteilungsfunktion mithilfe wilder Integral-Rechnungen ermitteln.
  • Die Wahrscheinlichkeit für einen ganz bestimmten (!) Wert ist gleich 0. Das liegt daran, dass es ja bei metrischen Variablen POTENZIELL unendlich viele Ausprägungsmöglichkeiten gibt. Und da sich Wahrscheinlichkeiten immer zu 1 aufsummieren, funktioniert das bei unendlich vielen Werten nicht. Denn die Wahrscheinlichkeiten für diese unendlich vielen Merkmalsausprägungen müssten sich ja auch zu 1 aufsummieren lassen, was jedoch nicht geht.

Zum Abschluss noch ein kleiner Steckbrief:

icon-logo-statistik

Steckbrief Dichtefunktion

  • Wird auch Wahrscheinlichkeitsdichte genannt
  • Nur für stetige Variablen möglich! Für diskrete Variablen gibt es die Wahrscheinlichkeitsfunktion
  • Visuelle Darstellung von Auftretenswahrscheinlichkeiten
  • Zeigt, an welcher Stelle sich die meisten Werte ansammeln und wie wahrscheinlich Merkmalsausprägungen in bestimmten Bereichen sind
  • Gehört zum Basiswissen für die schließende oder Inferenzstatistik
  • Kann immer nur positive Werte zwischen 0 und 1 annehmen
  • Die Wahrscheinlichkeiten für Werte in einem bestimmten Intervall werden mit der Integralrechnung ermittelt
  • Die Wahrscheinlichkeit für einen ganz bestimmten Wert = 0

Quellen:

Bortz, J., & Schuster, C. (2017). Statistik für Human- und Sozialwissenschaftler. Berlin: Springer.

Field, A. (2018). Discovering Statistics using IBM SPSS Statistics. London: SAGE.

Sedlmeier, P., & Renkewitz, F. (2018). Forschungsmethoden und Statistik für Psychologen und Sozialwissenschaftler. München: Pearson.

icon-logo-statistik
Probleme beim lernen von Statistik?
Wie wär's mit Lern-Tipps & einer Liste der besten Ressourcen?

Schnapp' dir dein gratis E-Book und werd' zum Statistik-Crack!

>