Reliabilität: Cronbachs α vs. McDonalds ω

Dr. R. Düsing · Universität Osnabrück
📋 Worum geht's
Cronbachs α ist der meistberichtete Reliabilitätskoeffizient — und der am häufigsten falsch verwendete. Er setzt Tau-Äquivalenz (gleiche Ladungen) und Eindimensionalität voraus. Sind diese verletzt, kann α die Reliabilität unterschätzen (ungleiche Ladungen) oder die Eindimensionalität vortäuschen (Mehrdimensionalität). McDonalds ω ist die robustere Alternative — in zwei Varianten: ωtotal und ωhierarchical. Dieses Tool zeigt, wann welche Zahl trügt. Voraussetzung: die Messmodelle (parallel/tau/kongenerisch).
Die drei Koeffizienten
Cronbachs α
setzt Tau-Äq. & 1 Dim. voraus
ωtotal
gesamte gemeinsame Varianz
ωhierarchical
nur Generalfaktor
Varianzzerlegung des Summenscores
Woraus besteht die Varianz des Gesamtscores? — und wo liegen α, ωt, ωh
Split-Half — α ist der Mittelwert aller Test-Halbierungen
Verteilung aller möglichen Split-Half-Reliabilitäten (Spearman-Brown-korrigiert)
Konzepte
Wann α unterschätzt
Bei ungleichen Ladungen (kongenerisch) behandelt α — als ungewichteter Summenscore — alle Items gleich und verschenkt Information: α < ωtotal. α ist dann eine Untergrenze der wahren Reliabilität. Lösung: ωtotal berichten.
Wann α täuscht
Bei Mehrdimensionalität (starke Gruppenfaktoren) zählen α und ωtotal auch die Gruppen-Varianz als „reliabel". Ein hohes α suggeriert dann eine Einheitlichkeit, die nicht existiert. ωhierarchical zeigt, wie viel wirklich auf den einen Generalfaktor entfällt — oft erschreckend wenig.
α = Mittel der Split-Halves
Split-Half teilt den Test in zwei Hälften und korreliert sie (Spearman-Brown-korrigiert). Das Ergebnis hängt davon ab, wie man teilt. Cronbachs α ist exakt der Mittelwert über alle möglichen Halbierungen — Panel ③ macht das sichtbar.
KR-20 & die Praxis
Für dichotome (0/1) Items ist KR-20 nichts anderes als Cronbachs α. Empfehlung der Methodenliteratur (Revelle, McDonald, Flora): standardmäßig ω berichten und bei Eindimensionalitäts-Zweifeln zusätzlich ωh.
Die Mess-Achse
Dieses Tool steht am Ende der Kette: KTT-Grundlagen (was ist Reliabilität) → Messmodelle (welche Annahme: parallel/tau/kongenerisch) → Faktoranalyse (Ladungen aus Daten schätzen) → hier (welcher Koeffizient ist korrekt). Die Ladungen, mit denen ω rechnet, kommen genau aus einem Faktormodell.
→ Messmodelle → Faktoranalyse
Reliabilität α vs. ω — Hintergrund
Das Modell

Die Items messen einen Generalfaktor (das eigentliche Konstrukt) mit Ladung λg,i. Optional gibt es zwei Gruppenfaktoren (Items 1…k/2 und Rest) mit Ladung λs — sie stehen für Mehrdimensionalität / inhaltliche Cluster / korrelierte Fehler. Items sind standardisiert (Var = 1), also θi = 1 − λg,i² − λs².

Die drei Koeffizienten
Var(S) = Var des Summenscores = ΣΣ Cov(X_i,X_j) ω_total = [ (Σλg)² + Σ_Gruppen(Σλs)² ] / Var(S) ω_hier = (Σλg)² / Var(S) α = k/(k−1) · ( 1 − Σ Var(X_i) / Var(S) )

ωtotal = Anteil der Varianz, der auf alle gemeinsamen Faktoren entfällt (General + Gruppen) = die gesamte Reliabilität. ωhierarchical = Anteil, der auf den Generalfaktor allein entfällt — das Maß für die Tragfähigkeit eines einzigen Summenscores. α nutzt nur die Item-Varianzen und -Kovarianzen, ohne die Faktorstruktur zu kennen.

Drei Szenarien

Tau-äquivalent (gleiche λg, λs = 0): α = ωt = ωh. Hier ist α exakt korrekt.
Kongenerisch (ungleiche λg, λs = 0): α < ωt = ωh. α unterschätzt — je ungleicher die Ladungen, desto größer die Lücke.
Mehrdimensional (λs > 0): ωh << ωt. α und ωt bleiben hoch, aber nur ein kleiner Teil entfällt auf den Generalfaktor — ein hohes α täuscht Eindimensionalität vor.

Warum α nicht gleich Unidimensionalität bedeutet

Ein verbreiteter Irrtum: „hohes α = homogene, eindimensionale Skala". Falsch — α steigt schon mit der Itemzahl und mit beliebigen positiven Korrelationen, ganz gleich woher sie kommen. Mehrere korrelierte Subdimensionen treiben α nach oben, obwohl die Skala nicht eindimensional ist. Nur ωh (oder eine explizite Faktoranalyse) deckt das auf.

Split-Half (Panel ③)

Teilt man den Test in zwei Hälften und korrigiert die Halbkorrelation per Spearman-Brown (rsh = 2r/(1+r)), erhält man ein Split-Half-Maß — dessen Wert aber von der Aufteilung abhängt. Cronbachs α ist der Durchschnitt über alle möglichen Halbierungen. Das Histogramm zeigt diese Verteilung; α (orange) liegt in ihrer Mitte, ωt (grün) meist darüber.

Empfehlung

Berichte standardmäßig ωtotal statt α (oder zusätzlich). Besteht der Verdacht auf Mehrdimensionalität, berichte ωhierarchical und prüfe die Faktorstruktur. α ist nicht „verboten", aber unter Tau-Äquivalenz ein Spezialfall von ω und sonst irreführend.

Literatur

Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 297–334.
McDonald, R. P. (1999). Test Theory: A Unified Treatment. Erlbaum.
Revelle, W. & Zinbarg, R. E. (2009). Coefficients alpha, beta, omega, and the glb. Psychometrika, 74, 145–154.
Flora, D. B. (2020). Your coefficient alpha is probably wrong. AMPPS, 3(4), 484–501.