EFA, CFA und SEM verständlich planen
Testkonstruktion, Faktorenanalyse und Strukturgleichungsmodelle: Wann welche Analyse sinnvoll ist
Wer in einer psychologischen Abschlussarbeit eigene Items entwickelt, steht häufig vor einer methodischen Herausforderung: Die Items sollen nicht nur inhaltlich plausibel klingen, sondern auch statistisch geprüft, reduziert und anschließend in ein theoretisches Modell eingeordnet werden. Spätestens wenn Begriffe wie Cronbachs Alpha, explorative Faktorenanalyse, konfirmatorische Faktorenanalyse, Kreuzvalidierung, Fit-Indizes oder Strukturgleichungsmodelle auftauchen, entsteht schnell Unsicherheit.
Diese Unsicherheit ist nachvollziehbar. Testkonstruktion und Strukturanalyse bestehen nicht aus einem einzelnen Statistiktest, sondern aus mehreren aufeinander aufbauenden Entscheidungen. Entscheidend ist deshalb nicht nur, welche Analyse „gerechnet“ wird, sondern in welcher Reihenfolge sie erfolgt und welche Fragestellung der jeweilige Analyseschritt beantwortet.
1. Der erste Schritt: Was sollen die Items messen?
Am Anfang steht die theoretische Klärung. Neu entwickelte Items sollen meist einen bestimmten Aspekt eines psychologischen Merkmals erfassen. Bevor statistische Verfahren eingesetzt werden, muss daher festgelegt werden, welches Konstrukt angenommen wird, welche Facetten unterschieden werden und welche Items diesen Facetten zugeordnet werden sollen.
Diese theoretische Vorarbeit ist zentral, weil sie später darüber entscheidet, ob eine explorative oder eine konfirmatorische Analyse angemessen ist. Wenn die Struktur noch unsicher ist, kann eine explorative Faktorenanalyse hilfreich sein. Wenn hingegen bereits ein klares theoretisches Modell besteht, prüft eine konfirmatorische Faktorenanalyse, ob die Daten zu dieser Modellannahme passen.
2. Itemanalyse: Welche Items sind geeignet?
Bei neu konstruierten Items stellt sich zunächst die Frage, welche Items überhaupt in die weiteren Analysen eingehen sollten. Dafür können verschiedene Kriterien betrachtet werden: Verteilung der Antworten, fehlende Werte, Trennschärfe, Item-Skala-Zusammenhänge, interne Konsistenz und inhaltliche Redundanz.
Cronbachs Alpha kann dabei ein hilfreicher Kennwert sein, reicht allein aber nicht aus. Ein hoher Alpha-Wert bedeutet nicht automatisch, dass eine Skala inhaltlich gut konstruiert ist. Ebenso kann ein niedriger Wert unterschiedliche Ursachen haben, etwa heterogene Items, zu wenige Items oder ein Konstrukt, das nicht eindimensional ist. Deshalb sollte die Itemauswahl nicht mechanisch nach einem einzelnen Kennwert erfolgen, sondern statistische Kennzahlen und theoretische Passung gemeinsam berücksichtigen.
3. Explorative Faktorenanalyse: Struktur entdecken
Die explorative Faktorenanalyse wird eingesetzt, wenn die zugrunde liegende Struktur der Items noch nicht sicher feststeht. Sie hilft zu prüfen, ob Items erwartungsgemäß zusammenhängen, wie viele Faktoren plausibel erscheinen und ob einzelne Items auf mehreren Faktoren laden.
Wichtige Begriffe sind dabei Kommunalitäten, Faktorladungen und Einfachstruktur. Kommunalitäten zeigen, wie gut ein Item durch die extrahierten Faktoren erklärt wird. Faktorladungen beschreiben, wie stark ein Item mit einem Faktor zusammenhängt. Eine Einfachstruktur liegt vor, wenn Items möglichst eindeutig auf einen Faktor laden und nicht gleichzeitig stark mit mehreren Faktoren zusammenhängen.
Gerade bei Abschlussarbeiten ist hier eine methodische Begleitung sinnvoll, weil Entscheidungen zur Extraktionsmethode, Rotation, Faktorenzahl und Itemausschluss nicht beliebig getroffen werden sollten.
4. Konfirmatorische Faktorenanalyse: Struktur prüfen
Die konfirmatorische Faktorenanalyse prüft ein vorab definiertes Messmodell. Im Unterschied zur explorativen Faktorenanalyse wird also nicht frei gesucht, welche Struktur in den Daten steckt. Stattdessen wird getestet, ob ein theoretisch begründetes Modell zu den Daten passt.
Dabei werden Fit-Indizes herangezogen, etwa CFI, TLI, RMSEA oder SRMR. Diese Kennwerte müssen gemeinsam betrachtet werden. Es ist methodisch problematisch, ein Modell allein deshalb als passend zu bewerten, weil ein einzelner Index akzeptabel ist, während andere deutlich gegen das Modell sprechen. Ebenso sollten Modifikationsindizes nicht unkritisch verwendet werden. Sie können Hinweise geben, ersetzen aber keine theoretische Begründung.
Eine CFA kann außerdem als Modell höherer Ordnung formuliert werden, wenn mehrere untergeordnete Faktoren durch einen übergeordneten Faktor erklärt werden sollen. Ob ein solches Modell sinnvoll ist, hängt jedoch von der theoretischen Struktur des Merkmals und von der Datenlage ab.
5. Kreuzvalidierung: Prüfen, ob das Modell stabil bleibt
Kreuzvalidierung bedeutet, dass eine gefundene oder angenommene Struktur nicht nur an denselben Daten geprüft wird, aus denen sie entwickelt wurde. Stattdessen wird untersucht, ob das Modell auch in einer unabhängigen Teilstichprobe oder einem getrennten Datensatz stabil bleibt.
Damit hängt Kreuzvalidierung eng mit EFA und CFA zusammen, ist aber nicht dasselbe. Eine typische Logik kann beispielsweise so aussehen: In einer Teilstichprobe wird mit EFA eine plausible Struktur exploriert. In einer zweiten Teilstichprobe wird diese Struktur mit CFA geprüft. Dadurch wird vermieden, dass ein Modell nur deshalb gut aussieht, weil es zu stark an eine einzelne Stichprobe angepasst wurde.
Ob diese Aufteilung sinnvoll möglich ist, hängt allerdings von der Stichprobengröße ab. Bei kleinen Stichproben kann eine strikte Kreuzvalidierung statistisch schwierig sein. In solchen Fällen müssen Alternativen und Limitationen transparent diskutiert werden.
6. Welche Analysen betreffen die neuen Items – und welche das Gesamtmodell?
Ein häufiger Denkfehler besteht darin, alle Analysen auf dieselbe Ebene zu beziehen. Bei Testkonstruktion und Strukturgleichungsmodellen müssen jedoch verschiedene Ebenen unterschieden werden.
Die Itemanalyse und eine mögliche EFA betreffen in der Regel zunächst die neu konstruierten Items. Dabei geht es um die Frage, welche Items geeignet sind und welche Struktur innerhalb dieser Itemgruppe plausibel ist.
Die CFA kann entweder nur das Messmodell der neu entwickelten Skala prüfen oder mehrere Konstrukte gemeinsam einbeziehen. Wenn zusätzlich validierte Fragebögen verwendet werden, können diese in ein erweitertes Messmodell oder später in ein Strukturgleichungsmodell integriert werden. Dann geht es nicht mehr nur um die Qualität einzelner Items, sondern um die Struktur des gesamten theoretischen Modells.
7. Voraussetzungen und typische Prüfungen
Für EFA, CFA und Strukturgleichungsmodelle müssen verschiedene Aspekte geprüft werden. Dazu gehören unter anderem Stichprobengröße, Skalenniveau, fehlende Werte, Verteilungen, Ausreißer, Faktorierbarkeit der Daten und die Angemessenheit des Schätzverfahrens.
Bei CFA und SEM spielt außerdem die Wahl des Schätzers eine wichtige Rolle. Maximum-Likelihood-Schätzung ist verbreitet, setzt aber bestimmte Bedingungen voraus. Bei ordinalen Likert-Items, deutlicher Nicht-Normalität oder kleinen Stichproben können alternative Schätzverfahren angemessener sein.
Die Frage, ob Items standardisiert werden müssen, ob Kovarianzen zugelassen werden oder wie mit korrelierten Fehlertermen umgegangen wird, lässt sich nicht pauschal beantworten. Solche Entscheidungen hängen vom Modell, von der Theorie und von der konkreten Datenstruktur ab. Genau hier entsteht häufig der größte Beratungsbedarf.
8. Warum methodische Planung vor der Analyse wichtig ist
Eine saubere Testkonstruktion entsteht nicht dadurch, dass möglichst viele Verfahren nacheinander gerechnet werden. Entscheidend ist ein Analyseplan, der festlegt, welche Frage mit welchem Verfahren beantwortet wird.
Ein möglicher Analysepfad kann beispielsweise so aussehen:
- Theoretische Zuordnung der Items zum Konstrukt
- Prüfung der Datenqualität und Antwortverteilungen
- Itemanalyse und Reliabilitätsprüfung
- Explorative Faktorenanalyse zur Strukturprüfung, falls die Struktur noch offen ist
- Kreuzvalidierung, wenn eine ausreichende Stichprobe vorliegt
- Konfirmatorische Faktorenanalyse zur Prüfung eines Messmodells
- Einbindung in ein erweitertes Strukturmodell, wenn Zusammenhänge zwischen Konstrukten getestet werden sollen
Dieser Ablauf ist kein starres Schema. Er zeigt jedoch, dass jede Analyse eine bestimmte Funktion erfüllt. Dadurch wird nachvollziehbar, wann EFA, CFA und Kreuzvalidierung zusammengehören und wann sie unterschiedliche Fragen beantworten.
9. Unterstützung durch Statistics Campus
Statistics Campus unterstützt Studierende und Forschende bei der Planung, Durchführung und Interpretation statistischer Analysen in psychologischen und sozialwissenschaftlichen Arbeiten. Dazu gehören unter anderem:
- Itemanalyse und Skalenbildung
- Reliabilitätsprüfung, etwa mit Cronbachs Alpha und weiteren Kennwerten
- explorative Faktorenanalyse
- konfirmatorische Faktorenanalyse
- Kreuzvalidierung von Messmodellen
- Pfadanalysen und Strukturgleichungsmodelle
- Auswahl geeigneter Schätzverfahren
- Interpretation von Fit-Indizes und Modifikationsindizes
- verständliche Darstellung der Ergebnisse im Methodik- und Ergebnisteil
Ziel ist nicht nur die Berechnung einzelner Kennwerte, sondern eine methodisch stimmige Auswertungsstrategie. Gerade bei neu entwickelten Fragebogenskalen ist es wichtig, Itemauswahl, Messqualität und Modellprüfung so zu verbinden, dass die Analyse wissenschaftlich nachvollziehbar bleibt.
Fazit
Testkonstruktion, Faktorenanalyse und Strukturgleichungsmodelle gehören zu den anspruchsvolleren Bereichen der statistischen Auswertung. Die zentrale Schwierigkeit besteht selten darin, einen einzelnen Befehl in R, SPSS, JASP oder Mplus auszuführen. Schwieriger ist die Entscheidung, welche Analyse zu welchem Zeitpunkt sinnvoll ist und wie die Ergebnisse methodisch korrekt interpretiert werden.
Wer eigene Items entwickelt und diese anschließend in ein psychologisches Modell einordnet, benötigt daher eine klare Analyselogik: zuerst Itemqualität prüfen, dann Struktur untersuchen, anschließend Messmodelle validieren und erst danach komplexere Pfad- oder Strukturgleichungsmodelle interpretieren.
Statistics Campus begleitet diesen Prozess von der ersten methodischen Orientierung bis zur verständlichen Ergebnisdarstellung.
Benötigen Sie Unterstützung bei Testkonstruktion, Faktorenanalyse oder Strukturgleichungsmodellen?
Statistics Campus begleitet Studierende, Forschende und Projektteams auf Deutsch, Griechisch und Englisch – von der methodischen Planung bis zur verständlichen Ergebnisdarstellung.


