Messmodelle — parallel · tau-äquivalent · kongenerisch

Dr. R. Düsing · Universität Osnabrück
📋 Worum geht's
Ein Messmodell beschreibt, wie beobachtbare Items mit einer latenten Variable (dem Konstrukt) zusammenhängen: jedes Item i lädt mit λi auf den Faktor und hat eine Fehlervarianz θi. Welche Annahmen man über diese Parameter trifft, entscheidet, welcher Reliabilitätskoeffizient korrekt ist. Genau das ist die fehlende Brücke zwischen Faktoranalyse und Reliabilität (α vs. ω).
① Modellklasse & Reliabilität
McDonalds ωtotal (korrekt)
ωt = (Σλ)² / [(Σλ)² + Σθ]
Cronbachs α
setzt Tau-Äquivalenz voraus
Lücke ωtotal − α
Unterschätzung durch α
② Messmodell — Pfaddiagramm
③ Implizierte Kovarianzmatrix
Konzepte
Die Modell-Hierarchie
Paralleltau-äquivalentkongenerisch — jedes Modell lockert eine Annahme: parallel verlangt gleiche λ und gleiche θ, tau-äquivalent nur gleiche λ, kongenerisch lässt beides frei. Je allgemeiner, desto realistischer — aber desto wichtiger der richtige Koeffizient.
Warum α die Tau-Äquivalenz braucht
Der Grund: α beruht auf dem ungewichteten Summenscore — jedes Item zählt gleich viel, ohne eigene Gewichtung. Das ist genau dann optimal, wenn alle Items das Konstrukt gleich gut messen, also gleiche Ladungen haben (Tau-Äquivalenz). Sind die Ladungen ungleich, behandelt α starke und schwache Items trotzdem gleich und verschenkt Information → es unterschätzt die Reliabilität. ω gewichtet jedes Item mit seiner Ladung und bleibt deshalb auch bei kongenerischen Daten korrekt.
Die Matrix verrät das Modell
Parallel: alle Diagonalen gleich, alle Kovarianzen gleich. Tau: Kovarianzen (λiλj) gleich, Varianzen ungleich. Kongenerisch: alles ungleich. Das Modell ist direkt an der implizierten Kovarianzmatrix ablesbar.
Brücke: EFA → Reliabilität
Die Faktoranalyse schätzt die Ladungen aus echten Daten; hier siehst du, welches Modell dahintersteht und welcher Koeffizient gilt. Das vertieft dann das α-vs-ω-Tool.
→ Faktoranalyse (EFA)
Müssen λ und θ exakt gleich sein?
In der Realität nie — die Modelle sind Idealisierungen, echte Werte streuen immer etwas (das Tool nutzt eine kleine Toleranz; minimale Slider-Bewegungen kippen die Klasse daher nicht sofort). Entscheidend ist, welche Gleichheit wofür zählt:
Ladungen λ entscheiden über α vs. ω — nur bei (annähernd) gleichen λ ist α exakt, sonst unterschätzt es.
Fehlervarianzen θ trennen nur parallel von tau-äquivalent. Da schon Tau-Äquivalenz für α = ω genügt, ist θ-Gleichheit für die Reliabilitätszahl irrelevant — sie zählt erst, wenn man echte Austauschbarkeit braucht.
Praxis: Gleichheits-Annahmen per CFA testen (χ²-Differenztest, CFI/RMSEA) — oder gleich ω berichten. Im Zweifel ω.
Wozu überhaupt parallel?
Für die Reliabilitätszahl bringt parallel nichts über tau-äquivalent hinaus — dort gilt bereits α = ω exakt. Der Gewinn von parallel ist die Austauschbarkeit: gleiche Ladungen und gleiche Fehlervarianzen machen alle Items (und ganze Testhälften oder -formen) zu echten gleichwertigen Replikaten. Erst dann kann man parallele Testformen (Form A/B) bauen, den Test beliebig in äquivalente Hälften teilen (Split-Half exakt, egal wie geteilt) und Items ohne Eigenschaftsänderung tauschen oder weglassen — jedes Item misst mit identischer Präzision (gleicher SEM). Der Preis: parallel ist die strengste und unrealistischste Annahme.
Messmodelle — Hintergrund
Was dieses Tool zeigt — und was nicht

Zeigt: die einfaktoriellen Messmodelle (parallel / tau-äquivalent / kongenerisch), ihr Pfaddiagramm, die implizierte Kovarianzmatrix und welcher Reliabilitätskoeffizient jeweils exakt ist — also eine sanfte CFA-Einführung. Nicht hier: die Schätzung der Ladungen aus Daten (→ Faktoranalyse) und die vertiefte α-vs-ω-Demonstration mit Split-Half/KR-20 (→ kommendes Reliabilitäts-Tool).

Das einfaktorielle Modell
X_i = ν_i + λ_i · F + e_i (F = latentes Konstrukt) Var(F) = 1 (zur Identifikation standardisiert) Var(X_i) = λ_i² + θ_i Cov(X_i, X_j) = λ_i · λ_j (i ≠ j)

λi ist die Ladung (wie stark das Item das Konstrukt misst), θi die Fehlervarianz (Messrauschen). Die Kovarianz zweier Items entsteht nur über den gemeinsamen Faktor — das ist die zentrale Annahme (lokale Unabhängigkeit).

Die vier Modellstufen
Modellλθkorrekt
ParallelgleichgleichSplit-Half = α = ω
Tau-äquivalentgleichfreiα = ω (exakt)
Essenziell tau-äq.gleich (+ Konst.)freiα = ω (exakt)
Kongenerischfreifreiω (α unterschätzt)

Essenziell tau-äquivalent erlaubt zusätzlich unterschiedliche Item-Mittelwerte (Intercepts νi). Da Mittelwerte die Kovarianzen nicht berühren, ist es für die Reliabilität identisch mit tau-äquivalent — an der Kovarianzmatrix nicht unterscheidbar. Schalte oben „Intercepts ν" ein: Du kannst die Item-Mittelwerte verschieben und siehst, dass die Klassifikation auf essenziell wechselt, während Matrix und ω/α unverändert bleiben.

Wie das Tool klassifiziert

Die Entscheidungs-Zeile unter der Modellklasse prüft die Annahmen direkt: Sind alle λ gleich? Sind alle θ gleich? (und mit Intercepts: alle ν gleich?). Aus den Antworten folgt die Modellklasse — gleiche λ & θ → parallel; nur gleiche λ → tau-äquivalent; ungleiche λ → kongenerisch; gleiche λ aber ungleiche ν → die jeweilige essenzielle Variante.

Toleranz & Praxis: „gleich" heißt hier innerhalb einer kleinen Toleranz — exakte Gleichheit gibt es in echten Daten nie. Real entscheidet man nicht per Augenmaß, sondern testet die Tau-Äquivalenz per CFA (Modellvergleich tau-äquivalent vs. kongenerisch, χ²-Differenztest / Fit-Indizes wie CFI, RMSEA) — oder man berichtet pragmatisch gleich ω, das keine Gleichheit voraussetzt und nie kleiner als die wahre Reliabilität ist. Im Zweifel ω.

Reliabilität — hier ist ω = ωtotal
ω_total = (Σλ_i)² / [ (Σλ_i)² + Σθ_i ] α = k/(k−1) · ( 1 − Σ(λ_i²+θ_i) / [ (Σλ_i)² + Σθ_i ] )

Das hier berechnete ω ist McDonalds ωtotal — der Anteil der Gesamtvarianz, der auf alle gemeinsamen Faktoren zurückgeht. Da dieses Tool ein einfaktorielles Modell zeigt (nur ein gemeinsamer Faktor), fällt hier ωtotal mit ωhierarchical (dem Anteil eines Generalfaktors) zusammen. Der Unterschied zwischen ωt und ωh wird erst bei Mehrdimensionalität relevant — das zeigen das Faktoranalyse-Tool (Schmid-Leiman) und das Tool „Reliabilität: α vs. ω".

Bei gleichen Ladungen lässt sich zeigen: α = ωtotal. Bei ungleichen Ladungen ist α < ωtotal — α ist dann eine Untergrenze der Reliabilität. Genau deshalb empfehlen Methodiker (z. B. McDonald, Revelle & Zinbarg) ω statt α, sobald Kongenerität plausibel ist.

Bezug zu CFA, EFA und IRT

Diese Modelle sind konfirmatorische Faktormodelle (CFA) mit Gleichheits-Restriktionen. Die explorative Faktoranalyse schätzt λ frei aus Daten; die IRT ist das Pendant für kategoriale Items (Ladung ↔ Diskrimination). Der Gruppenvergleich solcher Modelle ist das Thema Messinvarianz.

Literatur

Lord, F. M. & Novick, M. R. (1968). Statistical Theories of Mental Test Scores.
McDonald, R. P. (1999). Test Theory: A Unified Treatment. Erlbaum.
Revelle, W. & Zinbarg, R. E. (2009). Coefficients alpha, beta, omega, and the glb. Psychometrika, 74, 145–154.