Messfehler-Attenuierung

Laufendes Beispiel

Intelligenz & Schulleistung — Eine Studie misst Intelligenz (X) mit einem IQ-Test (r_xx = 0.85) und Schulleistung (Y) über Schulnoten (r_yy = 0.70). Die wahre Korrelation zwischen den latenten Konstrukten beträgt ρ = 0.60. In den Daten ist nur r ≈ 0.46 sichtbar — eine Unterschätzung von .14. Ohne Korrektur wird der Zusammenhang systematisch unterschätzt.

Grundprinzip

r_obs = ρ_true · √( r_xx · r_yy ) (Attenuierung)

ρ̂_true = r_obs / √( r_xx · r_yy ) (Disattenuation)

      Attenuierungsfaktor: 0.771
       · 
      r_obs (Theorie): 0.463
       · 
      Unterschätzung: −0.137
    

Latente Werte vs. Beobachtete Werte

ρ_true (Population)

—

wahre latente Korrelation

r_obs (Theorie)

—

ρ_true · √(r_xx · r_yy)

r_obs (Stichprobe)

—

empirische Korrelation

r_disattenuiert

—

r_obs / √(r_xx · r_yy)

Schlussfolgerung: Die beobachtete Korrelation r = — unterschätzt die wahre Korrelation ρ = — um —. Die Disattenuation liefert — — nahe am wahren Wert, aber nur wenn r_xx und r_yy korrekt bekannt sind. Fehlgeschätzte Reliabilitäten führen zu über- oder unterschätzten Korrekturen.

Konzepte

Was ist Attenuierung?

Messfehler in X oder Y reduziert die beobachtete Korrelation systematisch. Die Formel r_obs = ρ · √(r_xx · r_yy) zeigt: nur wenn beide Instrumente perfekt reliabel sind (r_xx = r_yy = 1.0), gilt r_obs = ρ_true. Jede Messungenauigkeit bringt den beobachteten Wert näher an Null. Attenuierung ist immer konservativ — sie unterschätzt nie nach oben.

Disattenuation — Korrektur

Spearman (1904) schlug die Formel ρ̂ = r_obs / √(r_xx · r_yy) vor. Sie wird in der Meta-Analyse (Schmidt & Hunter, 2015) routinemäßig angewendet, um Populationskorrelationen aus verzerrten Stichprobenkorrelationen zu schätzen. Voraussetzung: r_xx und r_yy müssen valide bekannt sein. Fehlerhafte Reliabilitätsschätzer führen zu Over- oder Undercorrection.

Einseitige vs. beidseitige Attenuierung

Wenn nur X fehlerbehaftet ist (r_xx < 1, r_yy = 1): r_obs = ρ · √(r_xx). Wenn nur Y fehlerbehaftet ist (r_xx = 1, r_yy < 1): r_obs = ρ · √(r_yy). Beidseitige Attenuierung (der Regelfall) ist stärker. Szenario D zeigt: selbst wenn eine Variable perfekt gemessen wird, bleibt Attenuierung durch die andere bestehen.

Range Restriction als Zusatzfaktor

Wenn die Stichprobe in X eingeschränkt ist (z.B. nur Bewerber, die eine Vorauswahl bestanden haben), sinkt die beobachtete Korrelation zusätzlich zur Attenuierung. Taylor & Russell (1939) und Thorndike (1947) entwickelten Korrekturen für direkte und indirekte Selektion. Beide Korrekturen zusammen (Messfehler + Range Restriction) sind in der Personalpsychologie Standard.

Konsequenzen für Forschungspraxis

Rohe (unkorrigierte) Korrelationen aus Primärstudien sind systematisch zu klein. Das hat Folgen für: theoretische Schlussfolgerungen (der wahre Zusammenhang ist stärker als gedacht), Kriteriumsvalidität von Tests (Prädiktoren erscheinen schwächer), und Power-Analysen (zu kleine erwartete Effekte → zu große geplante Stichproben). Ohne Korrektur wird Theorie auf attenueiten Befunden aufgebaut.

Grenzen & Instabilität bei kleinem N

Disattenuierte Werte > 1.0 sind mathematisch unmöglich und entstehen aus zwei Quellen: (1) fehlerhafte Reliabilitätsschätzer, oder (2) Stichprobenschwankung der empirischen Korrelation. Bei N < 200 ist Letzteres das größere Problem — r_obs schwankt so stark, dass der korrigierte Wert die wahre Korrelation häufig überschreitet (Zimmerman & Williams, 1997; Revelle & Condon, 2019). Kraemer (2005, Psych. Methods) empfiehlt Konfidenzmengen (confidence sets) statt Punktschätzern; Bootstrap-KIs sind stabiler als Delta-Methoden. Faustregel: N ≥ 200 für verlässliche Disattenuation. Die Korrektur setzt parallele Messungen voraus; bei heterogenen Items unterschätzt Cronbachs α die Reliabilität — McDonald's ω ist zuverlässiger.

Welche Reliabilität verwenden?

Hunter & Schmidt (2004) empfehlen eine klare Hierarchie: (1) Eigene Stichprobenreliabilität — aber nur wenn N > 200, da sonst der Schätzfehler die Disattenuation destabilisiert. (2) Normreliabilität aus Testmanualen — stabiler wegen größerer Normierungsstichproben, gültig wenn die eigene Stichprobe der Normierungspopulation ähnelt. (3) Meta-analytischer Mittelwert — nur bei expliziten Meta-Analysen.

Praxisregel: Bei N < 200 lieber Manualreliabilität — der Varianz-Bias-Trade-off spricht eindeutig für stabilere externe Schätzer. Unterschiedliche Populationen (z.B. klinisch vs. nicht-klinisch) haben aber oft systematisch verschiedene Reliabilitäten — deshalb sollte immer berichtet werden, welche Reliabilität woher stammt.

Messfehler-Attenuierung

Hilfe — Messfehler-Attenuierung