Dankeschön & 

Herzlich willkommen BEIm

CRASHKurs deskriptive statistik!

Deinem deskriptivstatistischen Glück steht nun nichts mehr im Wege...

Auf dieser Seite findest du die Folien, die Lösungen für die Aufgaben & danach die einzelnen Videos. 

TIPP: SETZ' DIR BITTE GLEICH EIN LESEZEICHEN, DANN FINDEST DU DIESE SEITE LEICHT WIEDER!

Falls du Fragen hast, hinterlass' sie mir bitte unten im Chat.

Nun wünsche ich dir ganz viel Spaß mit dem Kurs & gutes Lernen!

icon-logo-statistik

Folien für den Kurs:

Hinweis: Einige Folien haben einen schwarzen Hintergrund.

Falls du sie ausdrucken möchtest, teste doch bitte vorher kurz die Einstellungen, damit du alles gut lesen kannst.

warten-auf-onlinekurs-inferenzstatistik
icon-logo-statistik

Videos:

Teil 1: Einführung, Skalenniveaus & Häufigkeiten

Teil 2: Lagemaße

Teil 3: Streuungsmaße

Teil 4: Grafische Darstellungen & Boxplot

Teil 5: Chi-Quadrat-Koeffizient & Rangkorrelationskoeffizient

Teil 6: Kovarianz & Korrelationskoeffizient r

Teil 7: Praktische Anwendung mit SPSS

Geschafft! Ich bin echt stolz auf dich!

chamaeleon-bunt-nachher

Das Verständnis der deskriptiven Statistik ist ein super wichtiges Fundament,

um dich tapfer in die Welt der schließenden oder Inferenzstatistik aufzumachen.

Denn wenn du diesen Bereich der Statistik gut beherrschst,

wird die schließende Statistik definitiv machbar sein!

Selbstverständlich helfe ich dir gerne dabei!

Wenn dir der Crashkurs gefallen hat, wirst du ganz bestimmt meinen 

umfassenden Videokurs “Inferenzstatistik & SPSS leicht gemacht!” lieben!

Was dich im Videokurs erwartet:

  • über 17h Videos sowie Downloads
  • monatliche live Frage- & Antwort-Sessions mit mir
  • Quizfragen nach jeder Einheit
  • du kannst jederzeit im Kurs Fragen stellen
  • du lernst mit Spaß und sparst dir viel Zeit und Nerven!
  • du gewinnst Vertrauen in deine Fähigkeiten und wirst SO WAS VON fit für die Prüfung!

Übrigens kannst du den Kurs auch nutzen, wenn an deiner Hochschule R verwendet wird! 

Denn die Methoden und Interpretationen der Ergebnisse bleiben ja gleich. 

Bei SPSS sieht alles nur etwas schöner aus…

Den Videokurs “Inferenzstatistik & SPSS leicht gemacht!” findest du hier:

  • Merve sagt:

    Hallo Melanie,
    warum sind die Schulnoten keine intervallskalierte Variablen, da ist der Abstand zwischen Note 1 und Note 2, Note 3 und Note 4 ja auch jeweils 1 Notenpunkt?

    • Melanie Paul sagt:

      Hallo liebe Merve,
      bei Schulnoten streiten sich die Geister: Denn wenn du z. B. an Ausfragen in Geschichte oder Englisch denkst, gibt es keinen klaren Punktekatalog dafür, wann die 1+ endet oder beispielsweise die 2- beginnt. D. h., vieles in der Notengebung ist der individuellen Einschätzung überlassen und drückt somit eher eine Rangfolge im Sinne von besser oder schlechter aus. Somit sind die Schulnoten also ordinalskaliert, werden aber intervallskaliert verrechnet – einfach, weil es praktischer ist.
      Gäbe es hingegen in allen Fächern ganz klare Richtlinien, wann welche Notenstufe endet bzw. beginnt und was dafür genau erbracht werden muss, hätte man eine intervallskalierte Variable.
      Ich hoffe, das hilft dir!
      Liebe Grüße und gutes Lernen,
      Melanie

  • Nadia sagt:

    Hi Melanie,
    Ich habe 2 Fragen zu den Boxplots.
    1. Haben die Whiskers eine tiefere Bedeutung, also haben die irgendwas mit der Standardabweichung zu tun oder wie interpretiere ich die (für Tante Erna?)?
    2. Im Video dazu sagst du, dass man 13,5 x 3 rechnen muss, um auf die Extremwerte zu kommen. Müsste man nicht 20,25 x 3 rechnen? Die 13,5 sind ja der IQR.
    Und alle Werte zwischen der maximalen Whiskerlänge und Whiskerlänge x 3 sind dann „normale“ Ausreißer, habe ich das richtig verstanden?

    So viele Fragen, sorry?
    Liebe Grüße,
    Nadia

    • Melanie Paul sagt:

      Hallo liebe Nadia,

      du kannst selbstverständlich sehr gerne so viele Fragen stellen wie du möchtest!

      Zu 1.:
      Ja, die Whisker haben eine tiefere Bedeutung ;).
      Die Länge der Whisker zeigt an, die sehr die Werte streuen und somit, wie sehr sich die Versuchspersonen im untersuchten Merkmal voneinander unterscheiden. Lange Whisker: große Streuung und große Unterschiede, kurze Whisker: geringe Streuung und wenig Unterschiede.
      Zu 2.:
      Um zu bestimmen, wo die Ausreißer beginnen, muss man IQR, also die Länge der Box, mit 1.5 multiplizieren.
      Um zu bestimmen, wo die Extremwerte beginnen, muss man das gleiche Spiel machen, nur diesmal IQR mit 3 multiplizieren.

      Ja, alle Werte, die zwischen dem Whisker-Ende und dem Dreifachen der Box liegen, sind Ausreißer.

      Liebe Grüße und ein schönes Wochenende,
      Melanie

      • Nadia sagt:

        Hi Melanie,
        Ich habe den Kurs jetzt einmal durch und bin echt begeistert, wie verständlich du das alles rüberbringst. Vielen Dank dafür!?
        Ich habe noch eine Frage zum letzten Video: beim Beispiel mit dem Alter gibt SPSS ja einen IQR von 25 aus. Wie interpretiere ich diesen Wert? Also was sind die 25? Oder brauche ich den eigentlich wirklich nur zum Boxplot zeichnen? Das verwirrt mich ziemlich irgendwie.
        Danke schon mal für deine Antwort, ich werde mich jetzt deinem Inferenzstatistikkurs widmen?

        • Melanie Paul sagt:

          Hallo liebe Nadia,

          vielen Dank für dein Feedback, freut mich sehr!

          Ja, IQR braucht man zum Berechnen der Whisker, aber das hat auch eine inhaltliche Bedeutung: hier liegen die mittleren 50% aller Werte, also zwischen Q1 und Q3.
          Im Beispiel wäre das zwischen knapp 30 und knapp 60 Jahren, d. h. 50% der Teilnehmer*innen waren zwischen ca. 30 und 60 Jahren alt.

          Viel Spaß im Inferenzstatistik-Kurs!
          Liebe Grüße,
          Melanie

  • Nadia sagt:

    Mir ist noch eine Frage zur Korrelation eingefallen. Gibt es spezielle Koeffizienten für gemischte Skalenpaare wie nominal/ordinal, nominal/metrisch oder ordinal/metrisch? Oder verwendet man da die Methode für die niedrigere der beiden Skalen?

  • diane sagt:

    Schulnoten sind ja ordinalskaliert, das würde ja bedeuten man kann hier keinen Mittelwert bilden, das habe ich noch nicht ganz verstanden

    • Melanie Paul sagt:

      Hallo liebe Diane,
      ja, richtig, Schulnoten sind an sich ordinalskaliert (man denke beispielsweise an die z. T. eher „willkürliche“ Benotung von Deutsch-Aufsätzen oder Ausfragen in Englisch), werden aber aus Praktikabilitäts-Gründen wie eine intervallskalierte Variable behandelt, damit auch Mittelwerte berechnet werden können.
      Das ist wirklich ein Sonderfall, denn normalerweise darf man Variablen nicht „upgraden“.
      Ich hoffe, das hilft dir!
      Liebe Grüße,
      Melanie

  • Meike sagt:

    Liebe Melanie,
    im letzten Video (Video 7) bin ich bei der Aussage hängen geblieben, dass die Variable „Anzahl an Kindern“ stetig ist. Ich hätte aus dem Bauch gesagt, dass „Kinder“ diskret sind, eben weil man ja nicht immer kleiner Teile von Kindern messen kann (anders als bei Gewicht, Gehalt….). Es wäre toll, wenn du mir das noch einmal erläutern könntest.
    Vielen Dank für deine Mühe und bis bald!
    Meike

    • Melanie Paul sagt:

      Hallo liebe Meike,

      hier scheiden sich die Geister und auch die Lehrbücher sind uneins.
      An sich – rein vom gesunden Menschenverstand her – ist das natürlich ein diskretes Merkmal, aber es wird stetig verrechnet. Das hört man ja z. B. auch, wenn von der durchschnittlichen Kinderzahl in Deutschland gesprochen wird.
      Ich hoffe, das hilft dir!

      Liebe Grüße, Melanie

  • Noemi sagt:

    Liebe Melanie,
    ich habe leider nicht herausfinden können, ab wann ich jetzt „behaupten“ darf, dass zwischen zwei nominalskalierten Merkmalen, durch das Chi-Quadrat, ein Zusammenhang besteht. Anders als beim Rangkorrelationskoeffizienten R, sind ja eben keine Bereiche angegeben, für keinen ZSH, mittel, sowie stark. Das ist ja beinahe mehr so ein Gefühlsding, weswegen das Chi-Quadrat für mich ja beinahe wie ein „Wischi-Waschi“ für mich vorkommt. Gibt es irgendetwas an das ich mich da trotzdem halten kann, worauf sich die Statistiker durch ihre Erfahrung geeinigt haben?

    Liebe Grüße und sooooo ein super Kurs! Bringt mir wirklich mal Spaß. Hätte dich ja gerne als Allrounddozentin für alle meine Module, besonders die „Standardhorrorkompliziertlangweiligen“! 😀

    • Melanie Paul sagt:

      Liebe Noemi,
      vielen Dank für deine Nachricht und dein nettes Feedback zum Kurs!

      Man kann einen Maximalwert ausrechnen, den Chi-Quadrat annehmen kann, aber meines Erachtens wird das eher selten gemacht.

      Was hingegen getan wird, ist, mit einem Signifikanztest zu überprüfen, ob das Ergebnis bzw. der Zusammenhang auf die Grundgesamtheit übertragen werden darf.

      Da das jedoch in den Bereich der schließenden Statistik fällt, habe ich das im Kurs nicht behandelt (wird in meinen anderen Kursen besprochen).
      Ich hoffe, das hilft dir weiter!

      Liebe Grüße und weiterhin gutes Lernen!
      Melanie

      • Noemi sagt:

        Danke Melanie!

        Dann mache ich mir da keine Platte mehr, da ich gerade vom (intensiveren) Inferenzstatistikkurs die Einführung schon anschaue 😉 Ich warte also bis dahin.

        Liebe Grüße,

        Noemi

  • Nadine sagt:

    Hallo Melanie, warum ist der Modus bei der Aufgabe zum Selbermachen im zweiten Video 67? Ist er nicht 91?

    Viele Grüße
    Nadine

    • Melanie Paul sagt:

      Hallo liebe Nadine,

      der Modus ist der Wert (oder die Merkmalsausprägung), der am häufigsten vorkommt.

      In dieser Datenreihe kommt die 67 zweimal vor und die 91 nur einmal.
      Daher ist die 67 der Modus.

      Liebe Grüße,
      Melanie

      • Nadine sagt:

        Danke Dir für die schnelle Antwort. Dachte, der Modus sei der höchste Wert, nicht der, der am häufigsten vorkommt. Jetzt ist alles klar 🙂

  • Pia sagt:

    Liebe Melanie,

    ich schaue mir gerade dein Video zu Skalenniveaus an. Gerade frage ich mich, wie das mit Zeit ist. Da ich keinen natürlichen Nullpunkt habe müsste dies ja dann intervallskaliert sein – richtig? Rein theoretisch könnte ich ja auch eine Stunde definieren, welche 100 Minuten hat.

    • Melanie Paul sagt:

      Liebe Pia,

      die Zeit gilt tatsächlich als verhältnisskaliertes Merkmal, da es durchaus einen Nullpunkt gibt – ob dieser natürlich ist, sei dahingestellt – da lässt sich streiten.
      Es gibt aber auf jeden Fall keine negativen Werte bei der Zeit.
      Ich hoffe, das hilft dir!

      Liebe Grüße!

  • Romy sagt:

    Liebe Melanie,

    ich habe eine Frage bzgl. der Quantile:
    In meinem Skript werden diese unter den Streuungsmaßen genannt und nicht unter den Lagemaßen. ? Mir erscheint es aber ebenfalls sinnvoller, wie es bei Ihnen aufgeführt ist. Hätten Sie eine Idee wieso dies in meinem Skript anders ist.

    Liebe Grüsse,
    Romy

  • Katja Reipoehler sagt:

    Hallo Melanie,
    kann ich bei der y-Achse die Häufigkeiten auch in Klassen einteilen? Oder nur auf der X-Achse? Z.b. im Histogramm?
    Lg und Danke Katja

    • Melanie Paul sagt:

      Hallo liebe Katja,

      ja, du könntest vermutlich auch die y- Achse in Klassen einteilen.
      Das ist aber eher ungewöhnlich, zumindest habe ich das noch nie gesehen.

      Liebe Grüße,
      Melanie

  • Justine Pielok sagt:

    Hallo Melanie,
    ich habe eine Frage bezüglich des Interquartilsabstands. Ich kann mir nicht genau vorstellen, was mit den „mittleren 50% des Datensatzes“ gemeint ist? Wie muss ich mir das inhaltlich und grafisch vorstellen?

    Liebe Grüße und vielen Dank, Justine

    • Melanie Paul sagt:

      Liebe Justine,
      ich versuche das mal mit einem stark vereinfachten Beispiel:

      Stell‘ dir einen mit 1000ml Wasser gefüllten Messbecher vor.
      Dann liegen die mittleren 50% des ganzen Wassers (500ml) zwischen 250ml und 750ml.

      Oder du hast 100 Dominosteine, die du aneinanderreihst. Dann liegen die mittleren 50% des Datensatzes von 100 Steinen zwischen dem 25. und dem 75. Stein.

      Liebe Grüße,
      Melanie

  • Justine Pielok sagt:

    Hallo Melanie,
    ich habe zwei Fragen an dich.
    1. Ist auf Folie 124 (Folien vom Vormittag) ebenfalls ein Histogramm dargestellt, wie auf Folie 130?
    2. Ich habe bei deinem Beispiel zur Berechnung des Boxplots nicht verstanden, wie man die Extremwerte berechnet und ggf. einzeichnet. Kannst du mir das anhand eines Beispiels erklären?

    Ganz liebe Grüße und vielen Dank, Justine

    • Melanie Paul sagt:

      Liebe Justine,
      1. die beiden Grafiken, wo „Wie viele Std. Fernsehen pro Tag“ drübersteht, sind Histogramme.
      2. Die Extremwerte werden nicht berechnet, sondern einfach nur entsprechend ihres Werts eingezeichnet. Wenn ein Extremwert z. B. 85 wäre, dann zeichnest du ihn auf der Skala bei 85 ein.
      Du kannst dir dazu auch gerne noch mein YouTube-Video ansehen: https://www.youtube.com/watch?v=O3ZUbMxHnaQ&t=4s

      Liebe Grüße,
      Melanie

  • Justine sagt:

    Hallo Melanie,
    ich hätte zwei Fragen für dich:
    1. Rechnet man bei ordinalskalierten Variablen und beim Rangkorrelationskoeffizienten r mit den Rangplätzen oder mit dem Abstand der Werte der Rangplätze (z.B. Rangplatz 1: 9, Rangplatz 2: 5 –> Abstand zwischen Werte der Rangplätze wäre 4)?
    2. Ist Kendalls Tau äquivalent zum Rangkorrelationskoeffizienten r und kann bei gleicher Fragestellung verwendet werden?

    Herzliche Grüße,
    Justine

    • Melanie Paul sagt:

      Hallo liebe Justine,

      zu 1.: bei Spearman (Rangkorrelationskoeffizient) rechnet man mit den Differenzwerten, wenn kein Rangplatz mehrfach besetzt ist (das ist dann die vereinfachte Formel) oder mit den Rängen (ausführliche „Riesenformel“)

      Zu 2.: Prinzipiell kann Kendalls Tau für die gleiche Fragestellung verwendet werden. Klassischerweise ist es jedoch so, dass du Spearman verwendest, wenn du den Pearson-Korrelationskoeffizienten nicht anwenden kannst. Das wäre z. B. dann der Fall, wenn die Daten nicht normalverteilt sind oder Ausreißer vorliegen. Dann ist Spearman das bessere Maß. Liegen von vornherein ordinalskalierte Variablen vor, wird gewöhnlich Kendalls Tau verwendet.

      Liebe Grüße und weiterhin gutes Lernen,
      Melanie

  • Adriana sagt:

    Liebe Melanie,

    wie ich es verstanden habe, misst die Produkt-Moment-Korrelation den linearen Zusammenhang zwischen zwei metrischen Variablen. Gibt es eine Möglichkeit, einen LINEAREN Zusammenhang zwischen einer nominalen und einer intervallskalierten Variablen zu messen? Damit würde ich die Frage beantworten wollen, ob es eine lineare Beziehung zwischen diesen zwei Merkmalen gibt.

    Vielen Dank für die hilfreichen Videos und Deine Antwort! LG

    • Melanie Paul sagt:

      Liebe Adriana,
      als Maß dafür müsstest du die punktbiseriale Korrelation verwenden, die jedoch meines Erachtens keinen linearen Zusammenhang misst.
      Und: natürlich sehr gerne!
      Liebe Grüße,
      Melanie

  • Adriana sagt:

    Liebe Melanie,

    gibt es eine Möglichkeit, sich mit SPSS alle Werte ausgeben zu lassen, die z. B. drei Standardabweichungen unter dem Mittelwert liegen? Oder muss ich mir den Mittelwert und die Standardabweichung ausgeben lassen und es händisch berechnen? Vielen Dank! LG

    • Melanie Paul sagt:

      Liebe Adriana,

      das kann man mit etwas komplizierten Berechnungen m. E. schon machen – aber eben kompliziert.
      Vermutlich ist die händische Variante da besser.

      Schönes Wochenende und liebe Grüße,
      Melanie

  • Adriana sagt:

    Liebe Melanie,

    aus den Videos habe ich gelernt, wie man die Varianz berechnet. Gibt es eine Möglichkeit, den Maximalwert der Varianz zu berechnen? Zum Beispiel, die Varianz für ein Item liegt bei 3. Ich würde aber gerne wissen, wie groß die Varianz bei einer Antwortskala von 1 bis 10 sein könnte. Vielen Dank! LG

    • Melanie Paul sagt:

      Liebe Adriana,
      das ist mir leider nicht bekannt.

      Habe das gerade gegoogelt und vorwiegend Mathe-Foren gefunden.
      Schau doch einfach mal selbst, was Google so hergibt, und ob du in den Foren eine Antwort findest.

      Liebe Grüße,
      Melanie

  • >