Messfehler-Attenuierung

Dr. R. Düsing · Universität Osnabrück

Hilfe — Messfehler-Attenuierung

Was zeigt dieses Tool?

Messfehler attenuiert (verkleinert) Korrelationen systematisch. Die wahre Korrelation zwischen zwei latenten Konstrukten (X*, Y*) ist immer größer als die beobachtete Korrelation zwischen den fehlerbehafteten Messwerten (X, Y). Das Tool zeigt beide Welten nebeneinander.

Das laufende Beispiel

Eine Studie untersucht den Zusammenhang zwischen Intelligenz (X*) und Schulleistung (Y*). Ein IQ-Test misst Intelligenz mit Reliabilität r_xx = 0.85, Schulnoten messen Leistung mit r_yy = 0.70. Die wahre Korrelation ρ = 0.60 erscheint in den Daten nur als r ≈ 0.46.

Die Mathematik

r_obs = ρ_true · √(r_xx · r_yy)

Die Disattenuation (Korrektur) kehrt das um: ρ̂ = r_obs / √(r_xx · r_yy). Sie setzt voraus, dass r_xx und r_yy korrekt bekannt sind — eine starke Annahme.

Die zwei Panels

Links (lila): Latente wahre Werte X* und Y* — so würde die Welt aussehen, wenn Messung fehlerfrei wäre. Regressionsgerade mit Steigung ρ_true.
Rechts (blau): Beobachtete fehlerhafte Messwerte X und Y. Die Punktwolke ist breiter, die Regressionsgerade (blau) flacher. Die lila gestrichelte Linie zeigt zum Vergleich die wahre Steigung.

Bedienung

ρ_true: wahre latente Korrelation. r_xx / r_yy: Reliabilität der beiden Messinstrumente (1.0 = perfekt). Szenarien A–D illustrieren verschiedene Konstellationen.

Laufendes Beispiel
Intelligenz & Schulleistung — Eine Studie misst Intelligenz (X) mit einem IQ-Test (r_xx = 0.85) und Schulleistung (Y) über Schulnoten (r_yy = 0.70). Die wahre Korrelation zwischen den latenten Konstrukten beträgt ρ = 0.60. In den Daten ist nur r ≈ 0.46 sichtbar — eine Unterschätzung von .14. Ohne Korrektur wird der Zusammenhang systematisch unterschätzt.
Grundprinzip
r_obs = ρ_true · √( r_xx · r_yy ) (Attenuierung)
ρ̂_true = r_obs / √( r_xx · r_yy ) (Disattenuation)
Attenuierungsfaktor: 0.771  ·  r_obs (Theorie): 0.463  ·  Unterschätzung: −0.137
Latente Werte vs. Beobachtete Werte
ρ_true (Population)
wahre latente Korrelation
r_obs (Theorie)
ρ_true · √(r_xx · r_yy)
r_obs (Stichprobe)
empirische Korrelation
r_disattenuiert
r_obs / √(r_xx · r_yy)
Schlussfolgerung: Die beobachtete Korrelation r = unterschätzt die wahre Korrelation ρ = um . Die Disattenuation liefert — nahe am wahren Wert, aber nur wenn r_xx und r_yy korrekt bekannt sind. Fehlgeschätzte Reliabilitäten führen zu über- oder unterschätzten Korrekturen.
Konzepte
Was ist Attenuierung?
Messfehler in X oder Y reduziert die beobachtete Korrelation systematisch. Die Formel r_obs = ρ · √(r_xx · r_yy) zeigt: nur wenn beide Instrumente perfekt reliabel sind (r_xx = r_yy = 1.0), gilt r_obs = ρ_true. Jede Messungenauigkeit bringt den beobachteten Wert näher an Null. Attenuierung ist immer konservativ — sie unterschätzt nie nach oben.
Disattenuation — Korrektur
Spearman (1904) schlug die Formel ρ̂ = r_obs / √(r_xx · r_yy) vor. Sie wird in der Meta-Analyse (Schmidt & Hunter, 2015) routinemäßig angewendet, um Populationskorrelationen aus verzerrten Stichprobenkorrelationen zu schätzen. Voraussetzung: r_xx und r_yy müssen valide bekannt sein. Fehlerhafte Reliabilitätsschätzer führen zu Over- oder Undercorrection.
Einseitige vs. beidseitige Attenuierung
Wenn nur X fehlerbehaftet ist (r_xx < 1, r_yy = 1): r_obs = ρ · √(r_xx). Wenn nur Y fehlerbehaftet ist (r_xx = 1, r_yy < 1): r_obs = ρ · √(r_yy). Beidseitige Attenuierung (der Regelfall) ist stärker. Szenario D zeigt: selbst wenn eine Variable perfekt gemessen wird, bleibt Attenuierung durch die andere bestehen.
Range Restriction als Zusatzfaktor
Wenn die Stichprobe in X eingeschränkt ist (z.B. nur Bewerber, die eine Vorauswahl bestanden haben), sinkt die beobachtete Korrelation zusätzlich zur Attenuierung. Taylor & Russell (1939) und Thorndike (1947) entwickelten Korrekturen für direkte und indirekte Selektion. Beide Korrekturen zusammen (Messfehler + Range Restriction) sind in der Personalpsychologie Standard.
Konsequenzen für Forschungspraxis
Rohe (unkorrigierte) Korrelationen aus Primärstudien sind systematisch zu klein. Das hat Folgen für: theoretische Schlussfolgerungen (der wahre Zusammenhang ist stärker als gedacht), Kriteriumsvalidität von Tests (Prädiktoren erscheinen schwächer), und Power-Analysen (zu kleine erwartete Effekte → zu große geplante Stichproben). Ohne Korrektur wird Theorie auf attenueiten Befunden aufgebaut.
Grenzen & Instabilität bei kleinem N
Disattenuierte Werte > 1.0 sind mathematisch unmöglich und entstehen aus zwei Quellen: (1) fehlerhafte Reliabilitätsschätzer, oder (2) Stichprobenschwankung der empirischen Korrelation. Bei N < 200 ist Letzteres das größere Problem — r_obs schwankt so stark, dass der korrigierte Wert die wahre Korrelation häufig überschreitet (Zimmerman & Williams, 1997; Revelle & Condon, 2019). Kraemer (2005, Psych. Methods) empfiehlt Konfidenzmengen (confidence sets) statt Punktschätzern; Bootstrap-KIs sind stabiler als Delta-Methoden. Faustregel: N ≥ 200 für verlässliche Disattenuation. Die Korrektur setzt parallele Messungen voraus; bei heterogenen Items unterschätzt Cronbachs α die Reliabilität — McDonald's ω ist zuverlässiger.
Welche Reliabilität verwenden?
Hunter & Schmidt (2004) empfehlen eine klare Hierarchie: (1) Eigene Stichprobenreliabilität — aber nur wenn N > 200, da sonst der Schätzfehler die Disattenuation destabilisiert. (2) Normreliabilität aus Testmanualen — stabiler wegen größerer Normierungsstichproben, gültig wenn die eigene Stichprobe der Normierungspopulation ähnelt. (3) Meta-analytischer Mittelwert — nur bei expliziten Meta-Analysen.

Praxisregel: Bei N < 200 lieber Manualreliabilität — der Varianz-Bias-Trade-off spricht eindeutig für stabilere externe Schätzer. Unterschiedliche Populationen (z.B. klinisch vs. nicht-klinisch) haben aber oft systematisch verschiedene Reliabilitäten — deshalb sollte immer berichtet werden, welche Reliabilität woher stammt.