Range Restriction — MethodsLab

Laufendes Beispiel

Eignungsdiagnostik — Ein Unternehmen prüft, ob der Eignungstest X den späteren Berufserfolg Y vorhersagt. Die wahre Validität in der Bewerberpopulation ist ρ = 0.60. Eingestellt wird aber nur 20% (Selektion auf X). In dieser eingeschränkten Gruppe beobachtet man bloß r = — — der Test wirkt schwächer, als er ist. Die Thorndike-Korrektur liefert wieder ρ = —.

Was bedeuten die Symbole?

ρwahre Korrelation in der Gesamtpopulation (hier: wahre Test-Validität)

rbeobachtete Korrelation in der selektierten Gruppe

s_xStreuung (SD) von X in der Gesamtpopulation

s′_xStreuung von X in der selektierten Gruppe (Strich ′ = eingeschränkt)

uStreuungsverhältnis s′_x/s_x: < 1 = Einschränkung, = 1 = keine, > 1 = Erweiterung

UKehrwert 1/u (= s_x/s′_x) — Schreibhilfe in der Korrekturformel

bRegressionssteigung Y auf X — bleibt bei Selektion auf X unverzerrt

ρThorndike-korrigierte Schätzung von ρ aus r und u (sollte ρ treffen)

Gesamtpopulation vs. eingeschränkte Gruppe

ρ Population

—

wahre Korrelation

u = s′ / s

—

Streuungsverhältnis

r selektiert

—

beobachtet

ρ Thorndike

—

korrigiert zurück

Schlussfolgerung: —

Thorndike-Beziehung — beobachtetes r über dem Streuungsverhältnis u

Formel (Thorndike, Fall II — direkte Selektion auf X)

Attenuation: r = ρ·u / √( 1 − ρ²(1 − u²) ) mit u = s′_x/s_x

Korrektur: ρ = r·U / √( 1 + r²(U² − 1) ) mit U = 1/u = s_x/s′_x

      Aktuell: u = —  · 
      rbeobachtet = —  · 
      rFormel(ρ,u) = —  · 
      ρkorrigiert = —
    

Konzepte

Was ist Range Restriction?

Wird eine Stichprobe so gewonnen, dass nur ein Teil des Wertebereichs einer Variable vertreten ist, spricht man von Varianzeinschränkung. Weil die Korrelation die gemeinsame standardisierte Variation misst, sinkt sie, sobald die Streuung des Prädiktors gekappt wird. Der beobachtete Zusammenhang unterschätzt dann den wahren — ein häufiger Grund, warum Tests, Auswahlverfahren oder Prädiktoren scheinbar „nicht funktionieren".

Direkt vs. indirekt (Fall II vs. III)

Direkte Range Restriction (Thorndike Fall II): selektiert wird auf den Prädiktor X selbst (z. B. Cutoff im Eignungstest). Indirekte (Fall III): selektiert wird auf eine dritte Variable Z, die mit X korreliert — X wird nur „mitgekappt". Der indirekte Fall ist in der Praxis häufiger (z. B. Selektion auf ein früheres Gesamturteil) und braucht die erweiterte Formel von Lawley / die Korrektur nach Hunter, Schmidt & Le (2006). Dieses Tool zeigt den direkten Fall.

Korrelation sinkt, Steigung bleibt

Die wichtigste Lektion: unter direkter Selektion auf X ist nur die Korrelation verzerrt, die Regressionssteigung b_Y·X dagegen erwartungstreu. Grund: die bedingte Verteilung Y|X ändert sich durch X-Selektion nicht. Im rechten Plot haben rote (Selektion) und blau-gestrichelte (Population) Gerade dieselbe Steigung. Wer Vorhersagen braucht, kann die Regression auch aus eingeschränkten Daten gewinnen — wer Effektstärken vergleicht, muss korrigieren.

Extremgruppen — die Umkehrung

Behält man nur die obersten und untersten Werte (Extremgruppen-Design), vergrößert sich die Streuung von X (u > 1) und die Korrelation wird künstlich aufgebläht. Das ist die spiegelbildliche Verzerrung: beliebt, um Effekte „sichtbarer" zu machen, aber r und d sind dann nicht mehr auf die Population übertragbar. Probier Preset C: derselbe wahre ρ, aber r schießt nach oben.

Bezug zu Taylor-Russell

Die Taylor-Russell-Tabellen beantworten die ökonomische Folgefrage: Wenn ein Test die (korrigierte) Validität ρ hat, eine Selektionsquote angewandt wird und eine Grundquote an „Geeigneten" besteht — welcher Anteil der Ausgewählten ist erfolgreich? Range Restriction liefert das korrekte ρ als Eingabe; ohne Korrektur unterschätzt man den Nutzen des Verfahrens systematisch. → Taylor-Russell-Tafeln

Praxis & Literatur

Range Restriction ist ein Kernthema der Metaanalyse von Validitätsstudien (Personalauswahl, klinische Prädiktion, Hochschulzulassung). Faustregeln: (1) immer u = s′/s berichten; (2) bei Selektion auf X den Fall-II-, bei Selektion auf Drittvariablen den Fall-III-Korrektur verwenden; (3) korrigierte Werte als solche kennzeichnen. Literatur: Thorndike (1949); Sackett & Yang (2000); Hunter, Schmidt & Le (2006).

Abgrenzung: Berkson's Paradox

Gemeinsam: beide sind Selektionseffekte — eine nach einem Kriterium ausgewählte Teilgruppe verzerrt die beobachtete Korrelation, man sieht nie die ganze Population. Unterschied: Bei Range Restriction selektiert man direkt auf den Prädiktor X → r wird gedämpft (oder bei Extremgruppen aufgebläht), aber die Regressionssteigung b_Y·X bleibt erwartungstreu. Bei Berkson selektiert man auf einen Collider Z (gemeinsame Wirkung X→Z←Y) → es entsteht eine Scheinkorrelation aus dem Nichts, und auch die Steigung wird verzerrt. Kurz: hier ein Varianzproblem (mit Thorndike korrigierbar), dort ein Strukturproblem (Collider niemals kontrollieren). Die Brücke ist die indirekte Range Restriction (Fall III, Selektion auf eine Drittvariable). → Berkson's Paradox & Collider Bias

Range Restriction — Varianzeinschränkung & Korrelationsattenuation

Hilfe — Range Restriction (Varianzeinschränkung)