Dankeschön &

Herzlich willkommen BEIm

CRASHKurs deskriptive statistik! 

Deinem deskriptivstatistischen Glück steht nun nichts mehr im Wege...

Auf dieser Seite findest du die Folien, die Lösungen für die Aufgaben & danach die einzelnen Videos. 

TIPP: SETZ' DIR BITTE GLEICH EIN LESEZEICHEN, DANN FINDEST DU DIESE SEITE LEICHT WIEDER!

Falls du Fragen hast, hinterlass' sie mir bitte unten im Chat.

Nun wünsche ich dir ganz viel Spaß mit dem Kurs & gutes Lernen!

icon-logo-statistik

Folien für den Kurs:

Hinweis: Einige Folien haben einen schwarzen Hintergrund.

Falls du sie ausdrucken möchtest, teste doch bitte vorher kurz die Einstellungen, damit du alles gut lesen kannst.

warten-auf-onlinekurs-inferenzstatistik
icon-logo-statistik

Videos:

Teil 1: Einführung, Skalenniveaus & Häufigkeiten

Teil 2: Lagemaße

Teil 3: Streuungsmaße

Teil 4: Grafische Darstellungen & Boxplot

Teil 5: Chi-Quadrat-Koeffizient & Rangkorrelationskoeffizient

Teil 6: Kovarianz & Korrelationskoeffizient r

Teil 7: Praktische Anwendung mit SPSS

  • Merve sagt:

    Hallo Melanie,
    warum sind die Schulnoten keine intervallskalierte Variablen, da ist der Abstand zwischen Note 1 und Note 2, Note 3 und Note 4 ja auch jeweils 1 Notenpunkt?

    • Melanie Paul sagt:

      Hallo liebe Merve,
      bei Schulnoten streiten sich die Geister: Denn wenn du z. B. an Ausfragen in Geschichte oder Englisch denkst, gibt es keinen klaren Punktekatalog dafür, wann die 1+ endet oder beispielsweise die 2- beginnt. D. h., vieles in der Notengebung ist der individuellen Einschätzung überlassen und drückt somit eher eine Rangfolge im Sinne von besser oder schlechter aus. Somit sind die Schulnoten also ordinalskaliert, werden aber intervallskaliert verrechnet – einfach, weil es praktischer ist.
      Gäbe es hingegen in allen Fächern ganz klare Richtlinien, wann welche Notenstufe endet bzw. beginnt und was dafür genau erbracht werden muss, hätte man eine intervallskalierte Variable.
      Ich hoffe, das hilft dir!
      Liebe Grüße und gutes Lernen,
      Melanie

  • Nadia sagt:

    Hi Melanie,
    Ich habe 2 Fragen zu den Boxplots.
    1. Haben die Whiskers eine tiefere Bedeutung, also haben die irgendwas mit der Standardabweichung zu tun oder wie interpretiere ich die (für Tante Erna😄)?
    2. Im Video dazu sagst du, dass man 13,5 x 3 rechnen muss, um auf die Extremwerte zu kommen. Müsste man nicht 20,25 x 3 rechnen? Die 13,5 sind ja der IQR.
    Und alle Werte zwischen der maximalen Whiskerlänge und Whiskerlänge x 3 sind dann „normale“ Ausreißer, habe ich das richtig verstanden?

    So viele Fragen, sorry😅
    Liebe Grüße,
    Nadia

    • Melanie Paul sagt:

      Hallo liebe Nadia,

      du kannst selbstverständlich sehr gerne so viele Fragen stellen wie du möchtest!

      Zu 1.:
      Ja, die Whisker haben eine tiefere Bedeutung ;).
      Die Länge der Whisker zeigt an, die sehr die Werte streuen und somit, wie sehr sich die Versuchspersonen im untersuchten Merkmal voneinander unterscheiden. Lange Whisker: große Streuung und große Unterschiede, kurze Whisker: geringe Streuung und wenig Unterschiede.
      Zu 2.:
      Um zu bestimmen, wo die Ausreißer beginnen, muss man IQR, also die Länge der Box, mit 1.5 multiplizieren.
      Um zu bestimmen, wo die Extremwerte beginnen, muss man das gleiche Spiel machen, nur diesmal IQR mit 3 multiplizieren.

      Ja, alle Werte, die zwischen dem Whisker-Ende und dem Dreifachen der Box liegen, sind Ausreißer.

      Liebe Grüße und ein schönes Wochenende,
      Melanie

      • Nadia sagt:

        Hi Melanie,
        Ich habe den Kurs jetzt einmal durch und bin echt begeistert, wie verständlich du das alles rüberbringst. Vielen Dank dafür!😄
        Ich habe noch eine Frage zum letzten Video: beim Beispiel mit dem Alter gibt SPSS ja einen IQR von 25 aus. Wie interpretiere ich diesen Wert? Also was sind die 25? Oder brauche ich den eigentlich wirklich nur zum Boxplot zeichnen? Das verwirrt mich ziemlich irgendwie.
        Danke schon mal für deine Antwort, ich werde mich jetzt deinem Inferenzstatistikkurs widmen😉

        • Melanie Paul sagt:

          Hallo liebe Nadia,

          vielen Dank für dein Feedback, freut mich sehr!

          Ja, IQR braucht man zum Berechnen der Whisker, aber das hat auch eine inhaltliche Bedeutung: hier liegen die mittleren 50% aller Werte, also zwischen Q1 und Q3.
          Im Beispiel wäre das zwischen knapp 30 und knapp 60 Jahren, d. h. 50% der Teilnehmer*innen waren zwischen ca. 30 und 60 Jahren alt.

          Viel Spaß im Inferenzstatistik-Kurs!
          Liebe Grüße,
          Melanie

  • Nadia sagt:

    Mir ist noch eine Frage zur Korrelation eingefallen. Gibt es spezielle Koeffizienten für gemischte Skalenpaare wie nominal/ordinal, nominal/metrisch oder ordinal/metrisch? Oder verwendet man da die Methode für die niedrigere der beiden Skalen?

  • diane sagt:

    Schulnoten sind ja ordinalskaliert, das würde ja bedeuten man kann hier keinen Mittelwert bilden, das habe ich noch nicht ganz verstanden

    • Melanie Paul sagt:

      Hallo liebe Diane,
      ja, richtig, Schulnoten sind an sich ordinalskaliert (man denke beispielsweise an die z. T. eher „willkürliche“ Benotung von Deutsch-Aufsätzen oder Ausfragen in Englisch), werden aber aus Praktikabilitäts-Gründen wie eine intervallskalierte Variable behandelt, damit auch Mittelwerte berechnet werden können.
      Das ist wirklich ein Sonderfall, denn normalerweise darf man Variablen nicht „upgraden“.
      Ich hoffe, das hilft dir!
      Liebe Grüße,
      Melanie

  • Meike sagt:

    Liebe Melanie,
    im letzten Video (Video 7) bin ich bei der Aussage hängen geblieben, dass die Variable „Anzahl an Kindern“ stetig ist. Ich hätte aus dem Bauch gesagt, dass „Kinder“ diskret sind, eben weil man ja nicht immer kleiner Teile von Kindern messen kann (anders als bei Gewicht, Gehalt….). Es wäre toll, wenn du mir das noch einmal erläutern könntest.
    Vielen Dank für deine Mühe und bis bald!
    Meike

    • Melanie Paul sagt:

      Hallo liebe Meike,

      hier scheiden sich die Geister und auch die Lehrbücher sind uneins.
      An sich – rein vom gesunden Menschenverstand her – ist das natürlich ein diskretes Merkmal, aber es wird stetig verrechnet. Das hört man ja z. B. auch, wenn von der durchschnittlichen Kinderzahl in Deutschland gesprochen wird.
      Ich hoffe, das hilft dir!

      Liebe Grüße, Melanie

  • Noemi sagt:

    Liebe Melanie,
    ich habe leider nicht herausfinden können, ab wann ich jetzt „behaupten“ darf, dass zwischen zwei nominalskalierten Merkmalen, durch das Chi-Quadrat, ein Zusammenhang besteht. Anders als beim Rangkorrelationskoeffizienten R, sind ja eben keine Bereiche angegeben, für keinen ZSH, mittel, sowie stark. Das ist ja beinahe mehr so ein Gefühlsding, weswegen das Chi-Quadrat für mich ja beinahe wie ein „Wischi-Waschi“ für mich vorkommt. Gibt es irgendetwas an das ich mich da trotzdem halten kann, worauf sich die Statistiker durch ihre Erfahrung geeinigt haben?

    Liebe Grüße und sooooo ein super Kurs! Bringt mir wirklich mal Spaß. Hätte dich ja gerne als Allrounddozentin für alle meine Module, besonders die „Standardhorrorkompliziertlangweiligen“! 😀

    • Melanie Paul sagt:

      Liebe Noemi,
      vielen Dank für deine Nachricht und dein nettes Feedback zum Kurs!

      Man kann einen Maximalwert ausrechnen, den Chi-Quadrat annehmen kann, aber meines Erachtens wird das eher selten gemacht.

      Was hingegen getan wird, ist, mit einem Signifikanztest zu überprüfen, ob das Ergebnis bzw. der Zusammenhang auf die Grundgesamtheit übertragen werden darf.

      Da das jedoch in den Bereich der schließenden Statistik fällt, habe ich das im Kurs nicht behandelt (wird in meinen anderen Kursen besprochen).
      Ich hoffe, das hilft dir weiter!

      Liebe Grüße und weiterhin gutes Lernen!
      Melanie

      • Noemi sagt:

        Danke Melanie!

        Dann mache ich mir da keine Platte mehr, da ich gerade vom (intensiveren) Inferenzstatistikkurs die Einführung schon anschaue 😉 Ich warte also bis dahin.

        Liebe Grüße,

        Noemi

  • Nadine sagt:

    Hallo Melanie, warum ist der Modus bei der Aufgabe zum Selbermachen im zweiten Video 67? Ist er nicht 91?

    Viele Grüße
    Nadine

    • Melanie Paul sagt:

      Hallo liebe Nadine,

      der Modus ist der Wert (oder die Merkmalsausprägung), der am häufigsten vorkommt.

      In dieser Datenreihe kommt die 67 zweimal vor und die 91 nur einmal.
      Daher ist die 67 der Modus.

      Liebe Grüße,
      Melanie

      • Nadine sagt:

        Danke Dir für die schnelle Antwort. Dachte, der Modus sei der höchste Wert, nicht der, der am häufigsten vorkommt. Jetzt ist alles klar 🙂

  • Pia sagt:

    Liebe Melanie,

    ich schaue mir gerade dein Video zu Skalenniveaus an. Gerade frage ich mich, wie das mit Zeit ist. Da ich keinen natürlichen Nullpunkt habe müsste dies ja dann intervallskaliert sein – richtig? Rein theoretisch könnte ich ja auch eine Stunde definieren, welche 100 Minuten hat.

    • Melanie Paul sagt:

      Liebe Pia,

      die Zeit gilt tatsächlich als verhältnisskaliertes Merkmal, da es durchaus einen Nullpunkt gibt – ob dieser natürlich ist, sei dahingestellt – da lässt sich streiten.
      Es gibt aber auf jeden Fall keine negativen Werte bei der Zeit.
      Ich hoffe, das hilft dir!

      Liebe Grüße!

  • Romy sagt:

    Liebe Melanie,

    ich habe eine Frage bzgl. der Quantile:
    In meinem Skript werden diese unter den Streuungsmaßen genannt und nicht unter den Lagemaßen. 😅 Mir erscheint es aber ebenfalls sinnvoller, wie es bei Ihnen aufgeführt ist. Hätten Sie eine Idee wieso dies in meinem Skript anders ist.

    Liebe Grüsse,
    Romy

  • Katja Reipoehler sagt:

    Hallo Melanie,
    kann ich bei der y-Achse die Häufigkeiten auch in Klassen einteilen? Oder nur auf der X-Achse? Z.b. im Histogramm?
    Lg und Danke Katja

    • Melanie Paul sagt:

      Hallo liebe Katja,

      ja, du könntest vermutlich auch die y- Achse in Klassen einteilen.
      Das ist aber eher ungewöhnlich, zumindest habe ich das noch nie gesehen.

      Liebe Grüße,
      Melanie

  • >