Coaching bei Statistikfragen
Statistik Service
Hilfe bei Datenauswertung
Datenanalyse Hilfe
Prüfungsvorbereitung?
Statistische Beratung
Home Wissensdatenbank Statistik SPSS Python programmieren mit SPSS: Vorteile und Anwendungsbeispiele

Python programmieren mit SPSS: Vorteile und Anwendungsbeispiele

Veröffentlicht am . Zuletzt geändert am .
Python programmieren


SPSS Python programmieren: In heutiger Zeit sind statistische Analysen und grafische Darstellungen in SPSS und Python ein gängiges Tool, sowohl bei der Bachelorarbeit und Masterarbeit als auch bei der Dissertation und in Forschungsarbeiten, aber auch in jeder Industriebranche. Programme wie SPSS Software erlauben es Dir verschiedene Analysen, wie beispielsweise eine SPSS Clusteranalyse, durchzuführen, ohne dafür ein erfahrener User oder Programmierer zu sein. Die Bedingung ist intuitiv und benutzerfreundlich. Allerdings musst Du in der Regel jeden einzelnen Analyseschritt manuell per Mausklick anweisen bzw. ausführen. Das kann sowohl mühselig, als auch zeitaufwendig sein.

Im Unterschied dazu handelt es sich beim Python Programmieren um eine reine Open Source Programmiersprache, mit der Du Programme erstellen kannst. Dafür brauchst Du allerdings viel Zeit und viel Übung. Python zu programmieren ist etwas für Fortgeschrittene, jedoch im Unterschied zu SPSS Syntax allgemein einsetzbar. Durch das Kombinieren von Python Programmierung und SPSS kannst Du aber die Arbeitsschritte durch kurze Textblöcke (Codes) anweisen und automatisch ausführen und somit den Zeitaufwand deutlich reduzieren.

Python programmieren in SPSS – richtig installieren

Um Python programmieren zu können, kannst du also SPSS nutzen. Dazu muss Du das Tool „IBM SPSS Statistics Essentials for Python“ installieren. Beachte dabei, dass dieser Vorgang von deiner Software Version abhängt. Bitte recherchiere dazu im Internet (siehe z.B. die Hinweise des Herstellers) oder kontaktiere das Support-Team von IBM. Nach der Installation kannst Du im SPSS Syntax mit Python programmieren beginnen.

Python-Codes musst Du dann zwischen den Befehlen „begin program.“ und „end program.“ platzieren. Achte dabei auf alle Symbole und Zeichen wie Punkte und Klammern. In der Abbildung 1 kannst du links ein Beispiel für einen Python-Code sehen. Mit diesen Befehlen kannst Du dann überprüfen, ob Du Python korrekt installiert hast. In diesem Fall solltest Du im Output eine Nachricht erhalten wie in Abbildung 1 rechts dargestellt ist.

 Beispiel für Python programmieren mit SPSS Syntax
Abbildung 1: Beispiel für Python programmieren mit SPSS Syntax

Mit Python Codes für SPSS Auswertungen anweisen und automatisieren

Wie Du der Einleitung entnommen hast, kannst du durch das Python Programmieren SPSS Befehle automatisch Ausführen. Einzeilige Befehle kannst Du mit dem Code innerhalb des Python-Codes ausführen. Dabei musst du deinen Sytnax-Befehl zwischen den Anführungszeichen platzieren. Wichtig ist dabei, dass Du mit Python Programmieren die Reihenfolge und die Auswahl der Befehle bzw. der Variablen angibst. Diese Wahl gibst Du dann an Syntax weiter. Dafür musst Du in Syntax an die Stelle des Variablenamens den Ausdruck „%s“ setzten. Der Ausdruck, den Python an diese Stelle setzen wird, musst Du als letzte Zeile in Syntax mit

%(## DER GEWÜNSCHTE AUSDRUCK ##)

angeben. Im nächsten Beispiel kannst Du sehen, wie es funktioniert. Mit dem Code

Code 1

kannst Du zum Beispiel jeden zweiten Wert zwischen 1 und 10 aller Variablen aller Variablen im Output auflisten.

Dabei spielt es keine Rolle, wie viele Variablen Du hast und wie sie heißen. Hier ist das Objekt „Variablen“ die Liste der Variablennamen und „Ind1“ ist der Laufindex, der über die Anzahl der Variablen läuft. Dabei ersetzt Python „%s“ in Syntax mit jedem Variablennamen nacheinander. Das kriegst du mit dem Befehl %(Variablen[Ind1]) hin. Wenn du Hilfe bei den Codes brauchst, kann ein Statistik-Service eine gute Hilfe sein.

Aufwendige Analysen automatisieren

Du kannst solche Schleifen auch für mehrere Laufindices erstellen. Am folgenden Beispiel kannst Du sehen, wie Du durch das Python Programmieren eine aufwendige Analyse automatisch ausführen kannst. Angenommen Du hast einen Datensatz mit N Spalten gleicher Länge. Dabei möchtest Du mit den Spalten paarweise eine Kalkulation durchführen. Die Anzahl aller möglichen Kombinationen steigt dabei quadratisch mit N. Durch das Python Programmieren kannst Du SPSS anweisen, alle deine Kalkulationen automatisch auszuführen, wie Du dem unteren Beispiel entnehmen kannst:

Code 2

t-Tests

Mit diesem Code berechnest Du beispielsweise einen t-Test, paarweise für alle Paare deiner Variablen. Beachte, dass Du dabei zwei Laufindices verwendest „Ind1“ und „Ind2“. Deshalb kommt auch der Befehl „%s“ zwei Mal im Code vor. Eine ähnliche Aufgabe kannst Du mit diesem Code anweisen:

Code 3

Dabei weist du das Programm an, ähnlich wie im obigen Beispiel, paarweise für alle Variablen ein Streudiagramm zu erstellen. Für einen tieferen Einblick in die Syntax und das Python Programmieren sind McCormick 2017 und Theis 2017 hilfreich. Weitere Hilfe kannst Du bei einem Datenanalyse Service oder bei einer Statistik Beratung erhalten.

Das SPSS Programm bietet zahlreiche Analyse-Tools und es lässt sich intuitiv bedienen. Bei umfangreichen Analysen kann die Auswertung jedoch sehr mühselig werden. Durch das Kombinieren von der Software mit dem Python Programmieren, kannst Du deine Auswertung automatisch Ausführen lassen. Dabei können auch Programmierer mit wenig Erfahrung beim Python Programmieren ohne großen Aufwand fertige SPSS Funktionen nutzen.

Literatur

McCormick, Keith (2017): SPSS Statistics for Data Analysis and Visualization, Indianapolis.

Theis, Thomas (2017): Einstieg in Python: Programmieren lernen für Anfänger, Bonn.

Anderen Studenten hat auch das noch gefallen
Autor: