Laufendes Beispiel
Intelligenz & Schulleistung — Eine Studie misst Intelligenz (X) mit einem IQ-Test
(r_xx = 0.85) und Schulleistung (Y) über Schulnoten (r_yy = 0.70).
Die wahre Korrelation zwischen den latenten Konstrukten beträgt ρ = 0.60.
In den Daten ist nur r ≈ 0.46 sichtbar —
eine Unterschätzung von .14.
Ohne Korrektur wird der Zusammenhang systematisch unterschätzt.
Grundprinzip
r_obs
=
ρ_true
· √(
r_xx
·
r_yy
)
(Attenuierung)
ρ̂_true
=
r_obs
/ √(
r_xx
·
r_yy
)
(Disattenuation)
Attenuierungsfaktor: 0.771
·
r_obs (Theorie): 0.463
·
Unterschätzung: −0.137
Latente Werte vs. Beobachtete Werte
ρ_true (Population)
—
wahre latente Korrelation
r_obs (Theorie)
—
ρ_true · √(r_xx · r_yy)
r_obs (Stichprobe)
—
empirische Korrelation
r_disattenuiert
—
r_obs / √(r_xx · r_yy)
Schlussfolgerung: Die beobachtete Korrelation r = —
unterschätzt die wahre Korrelation ρ = — um
—.
Die Disattenuation liefert — — nahe am wahren Wert,
aber nur wenn r_xx und r_yy korrekt bekannt sind.
Fehlgeschätzte Reliabilitäten führen zu über- oder unterschätzten Korrekturen.
Konzepte
Was ist Attenuierung?
Messfehler in X oder Y reduziert die beobachtete Korrelation systematisch. Die Formel r_obs = ρ · √(r_xx · r_yy) zeigt: nur wenn beide Instrumente perfekt reliabel sind (r_xx = r_yy = 1.0), gilt r_obs = ρ_true. Jede Messungenauigkeit bringt den beobachteten Wert näher an Null. Attenuierung ist immer konservativ — sie unterschätzt nie nach oben.
Disattenuation — Korrektur
Spearman (1904) schlug die Formel ρ̂ = r_obs / √(r_xx · r_yy) vor. Sie wird in der Meta-Analyse (Schmidt & Hunter, 2015) routinemäßig angewendet, um Populationskorrelationen aus verzerrten Stichprobenkorrelationen zu schätzen. Voraussetzung: r_xx und r_yy müssen valide bekannt sein. Fehlerhafte Reliabilitätsschätzer führen zu Over- oder Undercorrection.
Einseitige vs. beidseitige Attenuierung
Wenn nur X fehlerbehaftet ist (r_xx < 1, r_yy = 1): r_obs = ρ · √(r_xx). Wenn nur Y fehlerbehaftet ist (r_xx = 1, r_yy < 1): r_obs = ρ · √(r_yy). Beidseitige Attenuierung (der Regelfall) ist stärker. Szenario D zeigt: selbst wenn eine Variable perfekt gemessen wird, bleibt Attenuierung durch die andere bestehen.
Range Restriction als Zusatzfaktor
Wenn die Stichprobe in X eingeschränkt ist (z.B. nur Bewerber, die eine Vorauswahl bestanden haben), sinkt die beobachtete Korrelation zusätzlich zur Attenuierung. Taylor & Russell (1939) und Thorndike (1947) entwickelten Korrekturen für direkte und indirekte Selektion. Beide Korrekturen zusammen (Messfehler + Range Restriction) sind in der Personalpsychologie Standard.
Konsequenzen für Forschungspraxis
Rohe (unkorrigierte) Korrelationen aus Primärstudien sind systematisch zu klein. Das hat Folgen für: theoretische Schlussfolgerungen (der wahre Zusammenhang ist stärker als gedacht), Kriteriumsvalidität von Tests (Prädiktoren erscheinen schwächer), und Power-Analysen (zu kleine erwartete Effekte → zu große geplante Stichproben). Ohne Korrektur wird Theorie auf attenueiten Befunden aufgebaut.
Grenzen & Instabilität bei kleinem N
Disattenuierte Werte > 1.0 sind mathematisch unmöglich und entstehen aus zwei Quellen: (1) fehlerhafte Reliabilitätsschätzer, oder (2) Stichprobenschwankung der empirischen Korrelation. Bei N < 200 ist Letzteres das größere Problem — r_obs schwankt so stark, dass der korrigierte Wert die wahre Korrelation häufig überschreitet (Zimmerman & Williams, 1997; Revelle & Condon, 2019). Kraemer (2005, Psych. Methods) empfiehlt Konfidenzmengen (confidence sets) statt Punktschätzern; Bootstrap-KIs sind stabiler als Delta-Methoden. Faustregel: N ≥ 200 für verlässliche Disattenuation. Die Korrektur setzt parallele Messungen voraus; bei heterogenen Items unterschätzt Cronbachs α die Reliabilität — McDonald's ω ist zuverlässiger.
Welche Reliabilität verwenden?
Hunter & Schmidt (2004) empfehlen eine klare Hierarchie: (1) Eigene Stichprobenreliabilität — aber nur wenn N > 200, da sonst der Schätzfehler die Disattenuation destabilisiert. (2) Normreliabilität aus Testmanualen — stabiler wegen größerer Normierungsstichproben, gültig wenn die eigene Stichprobe der Normierungspopulation ähnelt. (3) Meta-analytischer Mittelwert — nur bei expliziten Meta-Analysen.
Praxisregel: Bei N < 200 lieber Manualreliabilität — der Varianz-Bias-Trade-off spricht eindeutig für stabilere externe Schätzer. Unterschiedliche Populationen (z.B. klinisch vs. nicht-klinisch) haben aber oft systematisch verschiedene Reliabilitäten — deshalb sollte immer berichtet werden, welche Reliabilität woher stammt.