Coaching bei Statistikfragen

Statistik Nachhilfe

Hilfe bei Datenauswertung

Datenanalyse Beratung

Prüfungsvorbereitung?

Statistik Service
Home Wissensdatenbank Statistik SPSS Skalenniveau verstehen und in SPSS umsetzen

Skalenniveau verstehen und in SPSS umsetzen

Skalenniveau in SPSS


30 Okt Skalenniveau verstehen und in SPSS umsetzen

Skalenniveau in SPSS: Das Ziel einer wissenschaftlichen Untersuchung mithilfe der empirischen Methoden ist es eine Aussage zu treffen. Entweder willst Du dann herausfinden, ob Gemeinsamkeiten bzw. Unterschiede auftreten oder Du möchtest Hypothesen testen. Eventuell ist es Deine Absicht, Strukturen zu finden.

Für alle Methoden ist eine Sache aber unerlässlich – die Qualität der Daten, die Dir zur Verfügung stehen. Unterschiedliche statistische Verfahren erfordern unterschiedliche mathematische Prozesse für eine Datenanalyse. Hierfür sind bestimmte Informationen wichtig. Du kannst also mit dem Informationsgrad der Daten festlegen, was für Analysen möglich sind. Hier kommt schließlich das Skalenniveau ins Spiel. Es legt nämlich genau fest, welche Informationsdichte die Daten haben. Solltest Du Hilfe benötigen, können Dich unsere Experten mit unserem Datenanalyse Service untersützen.

Was ist ein Skalenniveau?

Doch was genau ist ein Skalenniveau eigentlich? Stelle Dir vor Du bist auf einem Konzert. Du stellst fest, natürlich sind dort außer Dir noch andere Menschen. Es fällt Dir auf, dass sowohl Frauen als auch Männer dort sind. Zudem sind die anwesenden Personen auch unterschiedlich alt und unterschiedlich groß. Alls das sind Informationen mit unterschiedlicher Aussagekraft – man spricht von unterschiedlichen Niveaus bzw. von unterschiedlichen Skalenniveaus.

Skalenniveau in SPSS
Abbildung 1: Skalenniveau in SPSS

Nominalskala

Nominalskalierte Daten haben das niedrigste Niveau an Informationsgehalt. Meist sind diese Variablen in Kategorien unterteilt, die man numerisch codiert (1 und 2 zum Beispiel). Haben die Daten nur 2 mögliche Ausprägungen, spricht man von dichotomen oder binären Variablen. Im Prinzip ist die Vergabe der Nummerierung egal, da diese nicht natürlich vorgegeben ist.
In unserem Beispiel vom Konzert ist dies die Information über das Geschlecht.

Hier gibt es zwei Möglichkeiten, männlich oder weiblich. Ob man nun männlich mit 1 und weiblich mit 2 codiert (dies entspricht unserem Ansatz, da er die Anzahl der X-Chromosomen widerspiegelt) oder umgekehrt, hat keinen Einfluss. Du kannst auch 12 für männlich und 978 für weiblich definieren, das ändert nichts. Entscheidend ist, dass die Daten alle gleichwertig sind. Somit sind auch keine Rechenoperationen möglich. Du kannst nur auswerten, wie häufig etwas vorkommt (vgl. Lamberti 2001: Seite 33). Beispiele dafür sind etwa Geschlecht, Farben, Religion. Der zugehörige Mittelwert wäre damit der Modus, das ist der Wert, dessen Anzahl am häufigsten vorgekommen ist.

Ordinalskala

Ordinalskalierte Daten haben eine Reihenfolge. Sie sind nach Rängen sortiert, man kann jedoch keine Aussage zu den Abständen machen. Das klassische Beispiel hierfür ist die Schulnote. Die Note 1 ist besser als die Note 3, man kann jedoch nicht sagen, dass eine 1 3-mal so gut ist wie eine 3. Auch bedeute der Abstand zwischen Note 1 und 2 nicht dasselbe wie der Abstand zwischen 4 und 5 (vgl. Lamberti 2001: Seite 34). Auch bei den ordinalskalierten Daten sind zudem keine Rechenoperationen möglich. Der zugehörige Mittelwert wäre damit der Median, das ist der Wert, der 50% Wert, der deine Beobachtungen in 2 gleich große Gruppen aufteilt.

Intervallskala

Intervallskalierte Daten sind die Masse der Daten, die auftreten. Es gibt eine klare Aussage über die Abstände der Daten, die sogenannten Intervalle sind genau definiert (vgl. Lamberti 2001: Seite 34). Bei der Temperatur beispielsweise ist der Abstand zwischen 12 und 16 Grad Celsius genau so groß ist wie der Abstand zwischen 20 und 24 Grad Celsius. Allerdings stimmt die Aussage nicht, dass 10 Grad doppelt so warm ist wie 20 Grad. Der Nullpunkt ist hier nämlich willkürlich festgelegt (Gefrierpunkt des Wassers). In unserem Beispiel vom Konzert ist zum Beispiel die Temperatur der Konzerthalle intervallskaliert. Der zugehörige Mittelwert wäre das arithmetische Mittel. Das ist der rechnerische Durchschnittswert aller Werte.

Ratioskala

Ratioskalierte Daten haben im Gegensatz zu den intervallskalierten Daten einen natürlichen Nullpunkt (vgl. Lamberti 2001: Seite 35). Hier wird oft das Alter als Beispiel herangezogen. Es trifft zu, dass sowohl die Abstände definiert sind, aber es lassen sich auch Aussagen über die Verhältnisse der Skala machen. So ist eine Person mit 20 Jahren doppelt so alt, wie jemand der 10 Jahre alt ist. Der Abstand beträgt 10 Jahre und ist der gleiche wie zwischen 40 und 50 Jahren. Weitere Skalen, die ratioskaliert sind, sind Entfernungen, Größen, Einkommen oder die Kelvinskala zur Temperaturbestimmung.
In unserem Beispiel vom Konzert ist beispielsweise die Körpergröße der Besucher eine ratioskalierte Variable.
Eine gute Übersicht erhält man bei der Methodenberatung der Universität Zürich. Hier ist die Hierarchie der verschiedenen Niveaus gut dargestellt.

Das Skalenniveau in SPSS

SPSS kennt drei verschiedene Arten für ein Skalenniveau: nominal, ordinal und metrisch. Metrisch fasst hierbei die Intervall- und Ratioskala zusammen. Mathematisch ist es egal, welche der beiden Skalen vorliegt, es ist eher eine inhaltliche Frage, ob etwas intervallskaliert oder ratioskaliert ist. Man muss wissen, dass die SPSS Software grundsätzlich alle Variablen als metrisch skaliert, da diese das höchste Skalenniveau besitzen und Dir damit alle Optionen offen stehen. Nach Einlesen eines Datensatzes solltest Du also immer zuerst einen Blick auf das Messniveau werfen und gegebenenfalls dieses Anpassen. Ein Statistik-Service kann Dir dabei behilflich sein.

Da SPSS auch Methoden zulässt, die ein bestimmtes Skalenniveau voraussetzen, das jedoch gar nicht gegeben ist, kommt es jedoch leicht zu Fehlern in der Anwendung und Interpretation der Ergebnisse. Das ist oft ein Problem beispielsweise bei einer Regressionsanalyse. Nichts ist so ärgerlich wie eine scheinbar bahnbrechende Erkenntnis, die aber nur aufgrund einer fehlerhaften Skalierung zustande kommt.

Tipps im Umgang mit dem Skalenniveau in SPSS

SPSS stellt wie eben gezeigt das Skalenniveau automatisch auf metrisch. Damit man aber nicht jede einzelne Variable auswählen muss, um einzeln das Messniveau zu ändern, kann man sich schneller behelfen. Am elegantesten und schnellsten geht das mit der SPSS Syntax. Man schreibt also eine Befehlsfolge und lässt diese durch SPSS ausführen.

Die Syntax sieht dann so aus:
VARIABLE LEVEL variable (scale).

Für variable die Variable(n) eintragen, deren Skalenniveau Ihr ändern wollt.
Für scale in der Klammer das Niveau festlegen:

NOMINAL für nominalskalierte Daten
ORDINAL für ordinalskalierte Daten
SCALE für metrischskalierte Daten

Eine weitere Möglichkeit ist im Variableneditor das Skalenniveau auszuwählen mit Strg+C zu in den Zwischenspeicher zu holen und diejenigen die man überschreiben will mit Strg+V überschrieben.

Das Skalenniveau ist der erste Wegweiser auf dem langen Weg einer empirischen Arbeit. Bereits in der Konstruktion eines Fragebogens oder in der Auswahl deiner Variablen legst du mit deren Skalenniveau fest was du letztlich auswerten kannst. Die Fragestellung stellt die Weiche welche Testverfahren genutzt werden können um diese zu beantworten. Das Skalenniveau ist wie gezeigt entscheidend, welche Testverfahren du berechnen kannst und ob du damit deine Forschungsfrage überhaupt beantworten und testen kannst. Eine Statistik-Beratung kann dir helfen, wenn du in der Sackgasse steckst.

Literatur

Lamberti, Jürgen (2001): Einstieg in die Methoden empirischer Forschung, Tübingen.

Anderen Studenten hat auch das noch gefallen
Autor: