Itemauswahl und Faktorenanalyse ALLBUS

Faktorenanalyse

Der nächste wichtige Schritt war die Faktorenanalyse. Nachdem eine erste inhaltliche Vorauswahl getroffen wurde, dient diese dazu die gewählten Items in passende Dimensionen zusammenzufassen. Dafür mussten aber zuerst einige Transformationen an den Daten vorgenommen werden. In meinem konkreten Fall hieß das das Zusammenfassen zweier Itembatterien zu eigenen kleinen Indizes (einmal v46 bis v60 zu einem Konfliktindex und einmal v733 bis v743 zu einem Vereinsmitgliedsschaftindex). Das war nötig, da die vielen einzelnen Variablen eine Faktorenanalyse erschwert hätten und es inhaltlich auch mehr Sinn macht, in einer Variable das gesamte Konfliktpontenzial vereint zu haben bzw. beim Vereinsindex nur zu prüfen, ob jemand überhaupt in einem Verein ist, anstatt zehn verschiedene Vereinstypen abzufragen. Desweiteren wurden v311 und v312 zusammengefügt, die jeweils abfragen ob man bereit ist, nach Ost- bzw. Westdeutschland überzusiedeln. Andernfalls wären die Variablen nicht brauchbar gewesen, da jeweils die andere Teilmenge fehlende Werte produziert hätte.

In einem ersten Schritt wurden alle Variablen einer Faktorenanalyse unterzogen. Die Anzahl der Faktoren wurde ersteinmal auf zehn begrenzt, da davon auszugehen ist, dass das die maximale Anzahl an sinnvoll zu interpretierenden Faktoren darstellt. Die Originalstudie hatte im Endeffekt zwar immerhin neun Dimensionen, allerdings aus allen Datensätzen aggregiert und nicht nur aus einem Einzigen. Das Ergebnis dieser ersten Faktorenanalyse sind im Folgenden zu sehen.
Kommunalitäten
Komponentenmatrix mit 10 Faktoren
Schaut man sich die Kommunalitäten an, kann man einige entdecken, die bereits bei zehn Faktoren sehr gering sind. Sie bedeuten den Anteil an der Varianz der jeweiligen Variable, die durch das Gesamtmodell, also alle Faktoren, erklärt wird. Es ist also logisch, dass sich dieser Wert mit der weiteren Reduzierung der Faktorenanzahl noch verringern kann.
Da eine inhaltliche Interpretation der zehn Faktoren nicht sinnvoll erschien, wurde im nächsten Schritt auf sechs Faktoren reduziert. Diese Entscheidung für genau sechs Faktoren beruht auf der Interpretation des Screeplot, der eine Faktorenanzahl von sechs bzw. vier Faktoren nahelegt.
Screeplot
Dabei wurden folgende Variablen aussortiert, allerdings erst nachdem sichergestellt wurde, dass sie auf keinen der übrig gebliebenen Faktoren inhaltlich sinnvoll geladen haben.

v65 VERTRAUEN ZU MITMENSCHEN
V725 BUERGER IM ANDEREN TEIL DER BRD FREMD?
V744 MITGLIED IN EINER GEWERKSCHAFT?
V746 MITGLIED: POLITISCHE PARTEI
übersiedlung1
konflikt1

Während v725, v744,v746 und übersiedlung1 inhaltlich durchaus verzichtbar sind und konflikt1 als einzelner Index stehenbleiben kann, ist der Verlust von v65 schwer zu rechtfertigen, sodass überlegt werden kann, ob die Variable auch allein stehenbleiben kann.

Die rotierte Komponentenmatrix mit sechs Faktoren ist hier zu sehen:
Die Faktoren ließen sich nun inhaltlich schon deutlich trennschärfer unterscheiden, sodass folgende vorläufige Interpretation entstand:

Faktor 1: exklusive gesellschaftliche Tendenzen
Faktor 2: finanzielle Ungleichheit erzeugt Ungerechtigkeit, Ellbogengesellschaft
Faktor 3: Xenophobie und allg. Egozentrismus
Faktor 4: staatl. Unterstützung begrüssenswert
Faktor 5: Leistungsgerechtigkeit
Faktor 6: Leistungsprinzip

V724 ZUKUNFT IM OSTEN HAENGT VON LEISTUNG AB
wurde dabei keinem Faktor zugeordnet.
In allen Fällen in denen eine Variable auf mehrere Faktoren lud, wurde sie dem Faktor mit der höheren Ladung zugeordnet. Eine Ausnahme bildet dabei
V720 IM WESTEN MEHR OPFERBEREITSCHAFT ZEIGEN,
die sowohl auf Faktor 3 und 4 fast gleichermaßen lud und schließlich Faktor 4 zugerechnet wurde.

Insgesamt blieben die Faktoren aber unscharf und ungeeignet für eine spätere Fusion mit anderen Datensätzen, da sie inhaltlich Überschneidungen aufweisen und gleichzeitig nicht homogen genug sind um inhaltlich zu überzeugen.

Wie bereits erwähnt ließ der Screeplot auch eine Interpretation mit vier Variablen gut zu, sodass erneut eine Faktorenanalyse mit einer Begrenzung von vier Faktoren durchgeführt wurde.
Dabei wurden weitere Variablen entfernt, die auf keinen der vier neuen Faktoren luden.
Im Gegensatz zu vorherigen Schritten, entsprach die statistische Aussortierung diesmal auch inhaltlichen Überlegungen.
Verworfen wurden:
verein1
V404 LETZTE 4 WOCHEN: EINSAM
V748 WAHLBETEILIGUNG, LETZTE BUNDESTAGSWAHL?
V63 POLITIKER UNINTERESSIERT AN EINF.LEUTEN
V64 MEHRHEIT UNINTERESSIERT AN MITMENSCHEN
V69 REVANCHE: ANDERE IN SCHWERE LAGE BRINGEN
V67 WERDE MICH FUER UNRECHT RAECHEN
V38 GUTES GELD FUER JEDEN,AUCH OHNE LEISTUNG
V720 IM WESTEN MEHR OPFERBEREITSCHAFT ZEIGEN

Die Komponentenmatrix mit vier Faktoren lieferte folgende Ergebnisse:
Die vier Faktoren wurden anschließend folgendermaßen operationalisiert:

Faktor 1: soziale Gerechtigkeit
Faktor 2: Chancengerechtigkeit
Faktor 3: Xenophobie
Faktor 4: Leistungsprinzip

Eine genauere Operationalisierung und weitere Informationen zu den vier Faktoren finden sich im nächsten Kapitel.
Reliabilitätsanalysen

Die durch die explorative Faktorenanalyse vorläufig erstellten Faktoren müssen zusätzlich einen Reliabilitätstest bestehen. In unserem Fall steht dabei der Wert Cronbachs alpha im Mittelpunkt.
Cronbachs alpha beschreibt die durchschnittliche Korrelation zwischen den einzelnen Items und misst so die interne Konsistenz eines Index.

Ein Wert <0,65 gilt dabei als kritisch, unter 0,5 als vollkommen inakzeptabel.

Im Unterschied zur Faktorenanalyse, spielt bei der Reliabilitätsanalyse auch die Polung der Items eine Rolle, wie im ersten Faktor gleich deutlich wird.


Faktor 1: soziale Gerechtigkeit
Definition: Der Faktor "soziale Gerechtigkeit" soll die Wahrnehmung und Bewertung
gesellschaftlicher Ungleichheiten widerspiegeln. In Abgrenzung zu Faktor zwei, der
Chancengerechtigkeit, geht es hier nicht um die individuellen Vorraussetzungen für persönlichen
Erfolg, sondern darum, wie die Gesellschaft mit Unterschieden umzugehen hat also ob diesen
entgegengewirkt werden soll oder ob sie toleriert oder sogar gefördert werden sollten. Grob
gesagt ist es ein JA oder NEIN zum Sozialstaat und damit zur Frage ob die Stärkeren einer
Gesellschaft den Schwächeren helfen sollen. Die Idee dahinter ist, Gesellschaft als etwas
Holistisches zu begreifen, in dem jeder davon profitiert wenn es möglichst Wenigen schlecht
geht.


In einer ersten Reliabilitätsanalyse ergab der Faktor 1 nur ein Cronbachs alpha von 0,405.
Dies lag, wie bereits erwähnt, an den verkehren Polung zweier Items. Nachdem diese per RECODE-Befehl angepasst wurden, wurde ein Cronbachs alpha von 0,753 erreicht.
wie man sieht, würde keine Streichung eines Items den Cronbachs alpha Wert signifikant erhöhen.

Faktor 2: Chancengleichheit

Definition: Der Faktor "Chancengleichheit" soll widerspiegeln, inwiefern die Befragten glauben,
dass persönlicher Erfolg in Deutschland von Faktoren beeinflusst wird, die zum größten Teil
unbeeinflussbar sind. Aber auch Faktoren wie Bestechung oder pol. Beziehungen werden
einbezogen, da sie in ähnlicher Weise "unlauteren Wettbewerb" suggerieren. Nicht die
Ungleichheit an sich ist hier Thema, sondern der Weg dorthin. Jemand, der gesellschaftliche
Ungleichheit als notwendig gutheisst, kann demnach aber trotzdem den Prozess der
Ungleichwerdung kritisieren.

Auch hier konnte ein guter Cronbach alpha Wert von 0,756 erreicht werden.
Faktor 3: Xenophobie

Definition: Dieser Faktor spiegelt wieder, wie offen jemand gegenüber Ausländern ist.
Gesellschaftlicher Zusammenhalt zeigt sich gerade in der Integration der "Neuen". Wer dagegen
den Einfluss der Neumitglieder einer Gesellschaft scheut, der verkennt gesellschaftliche
Realitäten und isoliert Teilgruppen einer Gesellschaft. Auch die Aufforderung sich von der
ursprünglichen Gesellschaft assimilieren zu lassen, diskriminiert Ausländer in ihrer kulturellen
Identität und verkennt abermals, dass sie bereits Teil der Gesellschaft sind. Deswegen ist auch
die Variable "Genereller Stolz, Deutscher zu sein" mit aufgenommen worden, da insbesondere in
der dt. Geschichte diese Aussage stark rassistisch konnotiert ist und Deutschland, bzw. die dt.
Gesellschaft als ein zu konservierendes Unikat darstellt, was wiederrum exklusive Tendenzen
einschließt.

Der Cronbachs alpha Wert liegt hier bei 0,681 und ist damit immernoch im guten Bereich. Er ließe sich durch das Streichen der Variable "Genereller Stolz, Deutscher zu sein" noch auf 0,722 steigern. Aus oben erwähnten inhaltlichen Erwägungen wird darauf aber verzichtet.
Faktor 4: Leistungsprinzip

Definition: Dieser kleine Faktor ist das Gegenstück zum Faktor 2 und spiegelt die Ansicht
wieder, dass für persönlichen Erfolg vorallem der eigene Wille ausschlaggebend ist. Für
gesellschaftlichen Zusammenhang bedeutet dies, dass jeder vorallem für sich selbst
verantwortlich ist und Ungleichheiten gerechtfertigt erscheinen.

Hier wird ein Cronbachs alpha von 0,664 erreicht, der wiederum durch die Streichung des Items "Wichtigkeit: Gute Ausbildung" gesteigert werden könnte. Tatsächlich passt dieses Item auch inhaltlich nur bedingt in den Index. Allerdings bestünde der Index dann nur noch aus zwei Items. Da die Verbesserung nur marginal wäre, bleibt das Item im Index.
Konflikt Index (konflikt1)

Der Konflikt-Index bildet eine (eigentlich zwei, da vier Variablen an anderer Stelle auftauchen, inhaltlich aber ähnlich sind) Fragebatterie nach, die sich damit
beschäftigt welche Konfliktlinien der Befragte in Deutschland für relevant hält. Er spiegelt also
das subjektive Empfinden der Polaritäten in Deutschland wider. Fast alle Konflikte sind solche,
bei denen jeder sich zu einer der Beiden Kategorien rechnen kann, sodass man daraus
schlussfolgern kann, dass sich die oder der Befragte persönlich angesprochen fühlt.

Durch die inhaltliche Nähe der Items, wird ein hoher Cronbachs alpha Wert von 0,896 erreicht.
Vereinsmitgliedschafts-Index
Der Vereinsmitgliedschafts-Index wurde ebenfalls aus einer Fragebatterie gebildet, die Mitgliedschaften in allen
möglichen Vereinen abfragte.
Die Anzahl der Mitgliedschaften wurde gezählt und anschließend kategorisiert, sodass
verein3 nun anzeigt ob die Befragte in mindestens einem Verein Mitglied ist.

SPSS-Syntax:
count verein2=v733 v734 v735 v736 v737 v738 v739 v740 v741 v742 v743 (3,4).
exe.
fre verein2.
recode verein2 (0=1) (1 thru hi=2) into verein3.
EXECUTE.
fre verein3.

Ergebnisse

Die durch Faktorenanalyse gewonnenen und durch Reliabilitätstests gecheckten Faktoren wurden anschließend zu Indizes programmiert
Dafür wurden zuvor alle Variablen z-standardisiert um eine bessere Vergleichbarkeit zu erreichen.
(bspw.
compute Xenophobie = mean.5(Zv318,Zv319,Zv320,Zv321,Zv326).
exe.)

Anschliessend wurden die so gemessenen Werte auf Bundesländerebene verglichen.Die Ergebnisse wurden farblich markiert, sodass ein Vergleich der Werte einfacher ist.
Werte <-0,15=rot
Werte -0,15-0,15=gelb
Werte >0,15=grün

Außerdem wurde teilweise die Polung der Indizes noch umgekehrt (bspw. compute chanceneu=Chancengleichheit*(-1).
exe.), sodass ein hoher Wert überall für sozialen Zusammenhalt steht.
Datensatz

Infos zum verwendeten Datensatz, und wo dieser zu finden ist, finden sich hier: Allbus