Coaching bei Statistikfragen
Statistik Nachhilfe
Hilfe bei Datenauswertung
Datenanalyse Hilfe
Prüfungsvorbereitung?
Statistische Beratung
Home Wissensdatenbank Statistik SPSS Boxplot mit SPSS interpretieren

Boxplot mit SPSS interpretieren

Veröffentlicht am . Zuletzt geändert am .
Korrelation in SPSS


Boxplot in SPSS: Durch Boxplot oder mit Grafiken kannst Du Deine Daten darstellen. Mit ihrer Hilfe kannst Du die Daten außerdem besser verstehen. Du kannst damit aber auch Verteilungen visualisieren oder ebenfalls Deine Daten auf Fehler prüfen. Der sogenannte Boxplot ist dabei eine sehr flexible Diagrammart. In dieser kleinen Handlungshilfe erfährst Du mehr über den Boxplot, wie Du ihn verwendest, aber auch wie Du ihn in der SPSS erstellst.

Der Boxplot in SPSS

Der Boxplot ist eine Kastengrafik. Er besteht aus einem Rechteck und zwei Linien. Die Linien werden wegen ihrer charakteristischen Form auch Antennen genannt. Andere Bezeichnungen sind auch Fühler oder Whisker. Sie sind die Verlängerung des Rechtecks.  Die Antennen werden zudem durch eine weitere Linie abgeschlossen.

Der Boxplot setzt mindestens ordinal gemessene Daten voraus. Du kannst den Boxplot sehr gut für verschiedene Ziele deiner Analyse verwenden. So kannst Du Dir beispielsweise einen schnellen Überblick über Deine Daten verschaffen. Ebenso kannst Du mit seiner Hilfe die Datenverteilung in SPSS prüfen. Mithilfe des Boxplots kannst Du zudem Ausreißer ausfindig machen. Du kannst aber auch eventuelle Fehler in deinen Daten aufspüren, wodurch schließlich eine Datenbereinigung mit SPSS naheliegt (zusätzliche Informationen findest Du auch bei der Fernuni Hagen).

Interpretation des Boxplots in SPSS

In SPSS enthält der Boxplot das 1. Quartil, das 3. Quartil sowie den Median. Zudem werden Ausreißer und Extremwerte angezeigt. Sind jedoch keine Ausreißer und Extremwerte vorhanden, bilden die abschließenden Linien das Maximum und Minimum.

Der Median teilt die Daten in zwei gleichgroße Hälften. Insgesamt wird die Verteilung jedoch in vier Einheiten eingeteilt. Jede Einheit beinhaltet 25% der Daten. Sind die Daten normalverteilt, dann liegt das arithmetische Mittel exakt auf dem Median. Das arithmetische Mittel hingegen wird in die Richtung der Ausreißer beeinflusst.

Ausreißer finden

Wenn 10 Testpersonen einen Messwert von 20 aufweisen, beträgt das arithmetische Mittel genau M= 20. Wenn nun eine weitere Testperson mit einem Messwert von 800 hinzukommt, so ist das arithmetische Mittel der 21 Personen circa M= 75,7.  Der Ausreißer zieht dann den Mittelwert in seine Richtung an. Der Median hingegen beträgt in beiden Stichproben MD=20. Er ist gewissermaßen robust gegenüber einer Verzerrung durch Ausreißer. Was dieser Fall konkret in deiner Arbeit bedeutet, kann eine Statistik Beratung erörtern.

Ausreißer können also einen Einfluss auf die Ergebnisse der statistischen Analyse nehmen. Sie können aber auch auf Fehler in den Daten hinweisen. Beispielsweise auf einen Tippfehler beim Übertragen der Daten in die SPSS Software.

In folgendem Beispiel siehst Du einen Boxplot mit Ausreißern und Extremwerten in der grafischen Darstellung in SPSS. Der Stern (*) markiert einen Extremwert. Der Kreis (o) stellt einen Ausreißer dar. Die dazugehörige Zahl ist der Fall im Datensatz von SPSS. Auf der linken Seite befindet sich die Werte-Achse. In diesem Beispiel die Jahre der Anstellung beim aktuellen Arbeitgeber der befragten Personen.

Boxplot in SPSS als Beispiel für Ausreißer und Extremwerte
Abbildung 1: Boxplot in SPSS als Beispiel für Ausreißer und Extremwerte

Verteilung prüfen

Mit dem Boxplot kannst Du unter Berücksichtigung der SPSS Syntax ebenso Verteilungen überprüfen. Sind die Flächen der Box gleich groß und die Fühler gleich lang, kannst Du eine Normalverteilung der Daten annehmen. Ist das obere 3. Quartil jedoch flächenmäßig größer als das untere 1. Quartil, so kannst Du die Verteilung der Daten als linkssteil einschätzen. Zusätzlich solltest Du aber auch Histogramme ansehen. Das Histogramm liefert Dir nämlich weitere wichtige Informationen. Im Histogramm kannst du beispielsweise auch mehrgipflige Verteilungen erkennen.

Mithilfe des Boxplots kannst Du jedoch auch Gruppen vergleichen. So kannst Du die Art der Verteilung mehrerer Gruppen in einer Variable gegenüberstellen.

Anfertigen eines Boxplot in SPSS

Zum Anfertigen eines Boxplots wähle Analysieren > Deskriptive Statistiken > Explorative Datenanalyse.

Boxplot über das Menü Explorative Datenanalyse erstellen
Abbildung 2: Boxplot über das Menü Explorative Datenanalyse erstellen

Bestimme im folgenden Fenster eine abhängige Variable. Aus ihr erstellst du den Boxplot. Zusätzlich kannst Du auch einen Faktor hinzufügen. Hiermit bildest Du Boxplots nach Gruppen.

Faktorenliste für die Gegenüberstellung von Boxplots nach Gruppen hinzufügen
Abbildung 3: Faktorenliste für die Gegenüberstellung von Boxplots nach Gruppen hinzufügen

Wähle die Schaltfläche Diagramme. Setze den Knopf auf Faktorstufen zusammen und setze ansonsten keine weiteren Häkchen.

Wahlmöglichkeiten für die Boxplots
Abbildung 4: Wahlmöglichkeiten für die Boxplots

Du erhältst eine Grafik mit zwei eingezeichneten Boxplots für die Gruppen.

Fallbeispiel für einen Boxplot mit SPSS

Die Ausgabe zeigt Dir die Boxplots der beiden Gruppen der Variable Geschlecht für ihr Einkommen an. Die Codierung der Variable Geschlecht ist hier für die Männer mit der Zahl 0 und für die Gruppe der Frauen mit 1 erfolgt. Beide Gruppen weisen ebenso einen Ausreißer auf. Diesen erkennst Du an der Markierung (o). Die nebenstehende Zahl zeigt Dir aber auch den Fall im Datensatz an. Diesen kannst du über die entsprechende Zeilennummer finden. Falls du dir hier noch unsicher bist, empfiehlt sich der Datenanalyse Service.

Beide Verteilungen sind schließlich linkssteil. Die Verteilung der Männer weist allerdings einen vergleichsweise breiteren Interquartilsabstand auf. Dieser ist der Abstand zwischen 1stem und 3tem Quartil, quasi die Breite der Box. Das Maximum des Einkommens der Gruppe der Männer liegt über dem der Frauen. Die Mediane der beiden Gruppen sind nahezu gleich.

Aus den Boxplots wird jedoch nicht zwingend deutlich, ob sich die Gruppen signifikant unterscheiden. Du kannst beispielsweise nachfolgende statistische Tests wie einen T-Test oder den U-Test in SPSS durchführen. Dadurch kannst du einen möglichen Unterschied erkunden. Die Stichproben der Gruppen sind aber relativ klein. Es liegen Daten von nMänner=16 und nFrauen = 19 vor. Zudem sind Ausreißer vorhanden. Daraufhin solltest Du eher einen nicht-parametrischen Test durchführen. Beispielsweise den Mann-Whitney-U Test.

Boxplots für die Variable Einkommen nach Geschlecht
Abbildung 5: Boxplots für die Variable Einkommen nach Geschlecht

Letztendlich ist das Erstellen von Boxplots mit SPSS empfehlenswert (vgl. Field 2017). Du erhältst dadurch nämlich wertvolle Informationen über Deine Daten. Du kannst beispielsweise die Verteilung prüfen. Zudem kannst Du feststellen, ob Ausreißer vorhanden sind. Mit diesen Informationen kannst Du dann die nächsten Schritte Deiner Analyse besser planen. Du kannst die Daten außerdem gegebenenfalls bereinigen, sie aber auch transformieren und schließlich im Rahmen eines geeigneten Tests berechnen. Dies lässt sich zuverlässig und unkompliziert mit dem Statistik Service abhandeln.

Literatur

Field, Andy (2017): Discovering Statistics Using IBM SPSS Statistics, 5. Auflage London.

Wooldridge, Jeffery (2013): Introductory Econometrics: A modern approach, 5. Auflage Mason (OH).

Anderen Studenten hat auch das noch gefallen
Autor: