Home Wissensdatenbank Statistik Deskriptive Statistik | Den Überblick über den Datensatz behalten

Deskriptive Statistik | Den Überblick über den Datensatz behalten

Deskriptive Statistik


30 Okt Deskriptive Statistik | Den Überblick über den Datensatz behalten

Deskriptive Statistik hilft dir, einen Überblick über deinen Datensatz zu gewinnen. Mit ihr kannst Du die zentrale Tendenz, Streuung und Verteilung deiner Stichprobe beschreiben. Auch das Erstellen von Grafiken und Tabellen gehört dazu. In folgendem Artikel erklären wir, wie man deskriptive Statistik anwenden kann.

Warum brauchst Du deskriptive Statistik?

Deine Datenanalyse wird selten mit deskriptiver Statistik enden, aber fast immer damit beginnen. Bevor Du deine eigentlichen Hypothesen prüfen kannst, brauchst Du eine Vorstellung davon, wie Deine Stichprobe aussieht. Spiegelt das Geschlechterverhältnis die Grundgesamtheit wider? Wie sieht es mit dem Alter oder dem Einkommen aus? Ist die Variable normalverteilt? Manchmal liefert die deskriptive Statistik auch zusätzliche Ideen, was Du Dir bei Deiner Analyse genauer ansehen solltest. Danach schließen sich oft statistische Tests oder statistische Verfahren an. Weitere Ideen kann Dir auch eine professionelle Datenanalyse Service liefern.

Tabellen für die deskriptive Statistik

Mit Tabellen kannst Du Dir einen prima Überblick über deine Variablen verschaffen. Sieh Dir dafür zum Beispiel Tabelle 1 an.

Beispiel für deskriptive Statistik - Alter und Geschlecht der Probanden
Tabelle 1: Beispiel für deskriptive Statistik – Alter und Geschlecht der Probanden (n=7) Quelle: Eigene Darstellung

Hier erkennst Du auf den ersten Blick, dass sieben Personen befragt wurden. Zusätzlich zum Alter wurde noch das Geschlecht erhoben. Bei einer größeren Stichprobe sind die Urtabellen meist zu unübersichtlich. Dann lohnt sich der Einsatz von Kreuztabellen, oder Tabellen, in denen die Antworten in Kategorien zusammengefasst wurden. Beispielsweise könntest Du das Alter in Tabelle 1 in die Kategorien [<22], [22-23] und [>23] einteilen.

Grafiken für die deskriptive Statistik

Alternativ zu Tabellen, kannst Du Deine Daten mit Grafiken veranschaulichen. Diese helfen Dir, ein Gefühl für Deine Daten zu entwickeln und lockern Vorträge und Präsentationen auf. In Abbildung 1 siehst Du zwei Möglichkeiten, die Verteilung des Geschlechts aus Tabelle 1 darzustellen. Grafische Darstellungen in SPSS erfreuen sich hierbei besonderer Beliebtheit.

Kreis- und Balkendiagramme der Variable „Geschlecht“
Abbildung 1: Kreis- und Balkendiagramme der Variable „Geschlecht“, Quelle: Eigene Darstellung

Kreisdiagramme eignen sich um Mehrheiten zu veranschaulichen. Offensichtlich wurden in unserem Beispiel mehr Männer als Frauen befragt, deshalb ist es schwierig, hier konkrete Werte herauszulesen. In diesem Fall sind Balkendiagramme besser geeignet, da sie absolute oder relative Häufigkeiten zeigen. Zudem kann unser Auge ihre Abstände besser interpretieren als die Winkel des Kreisdiagramms. Manchmal musst Du Dich jedoch zwischen Informationsgehalt und intuitiver Verständlichkeit entscheiden. Stamm-Blatt-Diagramme, Box- und Mosaikplots sind beispielsweise informativ, aber schwierig zu interpretieren. Du solltest sie nur verwenden, wenn Dein Gegenüber weiß, was sie darstellen. Das statistische Landesamt Baden-Württemberg hat sogar Beispiele dafür veröffentlicht, wie Grafiken uns täuschen können. Wenn du im Zweifel bist, kann dir auch eine Statistik Beratung unter die Arme greifen.

Kennzahlen für die deskriptive Statistik – Lagemaße

Viele Kennzahlen, die die deskriptive Statistik nutzt, sind schnell berechnet. Gleichzeitig liefern sie wertvolle Informationen. Dazu zählen Häufigkeiten (Gibt es mehr Männer als Frauen? Wie ist das prozentuale Verhältnis?), aber auch Lagemaße, wie Mittelwert, Median und Modus. Durch sie erkennst Du die zentrale Tendenz Deiner Daten. Der Modus verrät, welches Alter am häufigsten genannt wurde, dagegen beantwortet der Median, wie alt die jüngere Hälfte deiner Probanden ist. Und wenn Du wissen willst, wie alt die Befragten im Durchschnitt sind, berechnest Du den Mittelwert.

Schiefe als Kennzahl für die deskriptive Statistik

Sogar das Verhältnis von Modus, Median und Mittelwert zueinander verrät Dir etwas über Deine Daten. So kannst Du von einer symmetrischen Datenverteilung ausgehen, wenn sie etwa gleich groß sind. Sind dagegen Modus und Median kleiner als der Mittelwert, ist Deine Verteilung vermutlich rechtsschief. Das bedeutet, Du hast viele kleine Werte und wenige sehr große, die den Mittelwert verzerren. Jetzt kannst Du die Variable grafisch darstellen, oder eine weitere Kennzahl bestimmen: die Schiefe. Liegt diese unter null, sind Deine Daten linksschief. Rechtsschief sind sie hingegen bei einem Wert größer als null. Liegt die Schiefe jedoch bei exakt null, ist die Verteilung symmetrisch. Für unser Beispiel aus Tabelle 1 ergibt sich ein Mittelwert von 25,43 Jahren; für Modus und Median 22 Jahre. Das spricht für eine rechtsschiefe Verteilung und wird durch die Schiefe in Höhe von 2,01 bestätigt.

Kennzahlen für die deskriptive Statistik – Streuungsmaße

Lagemaße und Schiefe reichen oft nicht für ein anschauliches Bild Deiner Variable. Zusätzlich ist es sinnvoll, die Streuung anzusehen, also zu prüfen, wie unterschiedlich die Antworten Deiner Probanden ausfallen. Auch hierfür existieren verschiedene Kennzahlen. Es gibt zum Beispiel die Spannweite, die die Differenz zwischen dem größten und kleinsten gemessenen Wert wiedergibt. In unserem Beispiel beträgt die Spannweite 24 Jahre. Weiterhin kannst Du Quantile berechnen. Diese stellen Grenzwerte dar, unter oder auf denen ein bestimmter Prozentsatz Deiner Daten liegt. Beispielsweise ist der Median auch als 50 %-Quantil bekannt. Das bedeutet, 50 Prozent Deiner Befragten sind jünger als oder exakt 22 Jahre alt. Häufig genutzt wird zudem die Varianz – also die mittlere quadrierte Abweichung vom Mittelwert. Je größer diese ausfällt, umso stärker streuen Deine Daten. Ziehst Du daraus die Wurzel, erhältst Du die Standardabweichung. Dividierst Du diese durch den Mittelwert, erhältst Du den Variationskoeffizient. Diese ganzen Analysen, aber auch der Erkennen von Ähnlichkeitsstrukturen durch eine SPSS Clusteranalyse, kannst Du entspannt mit der SPSS Software durchführen. Das Statistikprogramm R könnte hierfür eine kostenlose Alternative sein.

Die deskriptive Statistik ist ein elementarer Teil der Datenanalyse. Zwar ist sie allein selten ausreichend, um Deine Hypothesen zu prüfen, sie bildet jedoch die Grundlage dafür. Mit ihrer Hilfe erhältst Du ein klareres Bild Deiner Daten hinsichtlich Repräsentativität, Verteilung und mittlerer Tendenz. Darüber hinaus stellt sie nicht nur eine gute Entscheidungshilfe für die Wahl deiner weiteren Analysemethoden dar, manchmal ergeben sich durch sie auch völlig neue Fragestellungen. Wenn du Fragen hast, kannst Du Dich diesbezüglich auch an den Statistik Service wenden.

Anderen Studenten hat auch das noch gefallen
Autor: