Taylor-Russell-Tafeln — Selektionsnutzen eines Tests

Dr. R. Düsing · Universität Osnabrück

Hilfe — Taylor-Russell-Tafeln

Macht / macht NICHT

Macht: berechnet, welcher Anteil der mit einem Test Ausgewählten später erfolgreich/geeignet ist — in Abhängigkeit von Validität, Selektionsrate und Basisrate. Zeigt Tafel und Nomogramm und macht sichtbar, dass die Tafelwerte Stützstellen einer stetigen Funktion sind. Macht NICHT: keine Kosten-Nutzen-Analyse in Geld (das wäre Brogden-Cronbach-Gleser) und keine Korrektur von Verzerrungen — als Validität sollte die für Range Restriction korrigierte Korrelation eingesetzt werden.

Worum geht es?

Taylor & Russell (1939) beantworten die praktische Frage: „Lohnt sich ein Auswahltest?" Ein Test mit Validität ρ ist umso nützlicher, je selektiver man auswählt und je nach Basisrate der Eignung. Der Nutzen ist die Erfolgsquote der Ausgewählten minus der Basisrate (= was man ohne Test hätte).

Das laufende Beispiel

Eine Klinik (oder Personalabteilung) wählt Bewerber per Eignungstest aus. Validität = Korrelation Test ↔ späterer Erfolg. Selektionsrate = Anteil der Bewerber, der genommen wird. Basisrate = Anteil, der ohne Test erfolgreich wäre. Ergebnis: die Erfolgsquote der Ausgewählten = positiver prädiktiver Wert.

So liest man die Tafel

Eine Tafel gilt immer für eine Basisrate (oben per Schieber wählbar). Zeilen = Validität (aufsteigend), Spalten = Selektionsrate. Der Zellwert ist die Erfolgsquote in Prozent. Die aktuell eingestellte Kombination ist umrandet. Faustregeln: bei strenger Selektion (kleine Spalte) und mittlerer Basisrate bringt schon mäßige Validität viel; bei Basisrate nahe 0 oder 1 ist kaum etwas zu holen.

Das Nomogramm + Zielkreuz

Das Nomogramm zeigt dieselbe Information stetig: x-Achse = Validität, y-Achse = Erfolgsquote, jede Kurve eine Selektionsrate. Die waagerechte Linie ist die Basisrate (Start aller Kurven bei Validität 0). Klicke ins Diagramm, um ein Zielkreuz zu setzen: die Validität ergibt sich aus der x-Position, die Selektionsrate rastet auf die nächstgelegene Kurve. Gestrichelte Linien fallen auf beide Achsen, die Fenster darunter zeigen die exakten Werte.

Die Symbole

ρ — Validität (Korrelation Test ↔ Kriterium).
SR — Selektionsrate = Anteil ausgewählt (selection ratio).
BR — Basisrate = Anteil in der Population, der das Erfolgskriterium erfüllt (base rate).
EQ — Erfolgsquote der Ausgewählten = positiver prädiktiver Wert (PPV).
Lift — Zugewinn EQ − BR (Nutzen gegenüber „ohne Test auswählen").

Formel

Bivariate Normalverteilung von Prädiktor X und Kriterium Y mit Korrelation ρ. Kriteriumsschwelle yc = Φ⁻¹(1−BR), Selektionsschwelle xc = Φ⁻¹(1−SR). Dann EQ = P(Y > yc | X > xc) = P(X>xc, Y>yc) / SR. Bei ρ = 0 ist EQ = BR (Test nutzlos), bei ρ = 1 ist EQ = min(BR/SR, 1).

Laufendes Beispiel
Lohnt sich der Auswahltest? — Ohne Test wären 50% der Bewerber erfolgreich (Basisrate). Mit einem Test der Validität ρ = 0.50, bei dem die besten 20% genommen werden, steigt die Erfolgsquote der Ausgewählten auf % — ein Zugewinn von Prozentpunkten gegenüber „blind auswählen".
Was bedeuten die Symbole?
ρValidität — Korrelation zwischen Test und späterem Erfolgskriterium
SRSelektionsrate — Anteil der Bewerber, der ausgewählt wird (klein = streng)
BRBasisrate — Anteil, der ohne Test das Kriterium erfüllt
EQErfolgsquote der Ausgewählten = positiver prädiktiver Wert (PPV)
LiftEQ − BR — der inkrementelle Nutzen des Tests in Prozentpunkten
Φ⁻¹Quantil der Standardnormalverteilung — übersetzt Anteile in Schwellenwerte
Basisrate BR
ohne Test
ρ Validität
Test ↔ Kriterium
Selektionsrate SR
Anteil gewählt
Erfolgsquote EQ
PPV der Gewählten
Lift = EQ − BR
Inkrementeller Nutzen
Taylor-Russell-Tafel — Erfolgsquote (%) bei Basisrate 0.50
↓ Zeilen: Validität ρ (aufsteigend) → Spalten: Selektionsrate SR  ·  umrandet = aktuelle Einstellung
Nomogramm — dieselbe Tafel als stetige Funktion

Ins Diagramm klicken setzt das Zielkreuz: x → Validität, Selektionsrate rastet auf die nächste Kurve. Gestrichelte Linien zeigen die Projektion auf beide Achsen.

Lesart:
Konzepte
Die Grundidee (Taylor & Russell 1939)
Der Nutzen eines Auswahltests lässt sich nicht allein an seiner Validität ablesen. Entscheidend ist das Zusammenspiel mit zwei Kontextgrößen: der Selektionsrate (wie streng wird ausgewählt?) und der Basisrate (wie viele wären ohnehin erfolgreich?). Taylor und Russell legten dafür unter der Annahme bivariater Normalverteilung Tafeln vor, die die Erfolgsquote der Ausgewählten liefern.
Warum die Selektionsrate so wirkt
Je strenger selektiert wird (kleine SR), desto weiter rechts liegt der Schwellenwert auf dem Test — und desto stärker schlägt selbst eine moderate Validität durch. Bei SR = 1 (alle werden genommen) ist die Erfolgsquote zwangsläufig gleich der Basisrate: ohne Auswahl kein Nutzen. Im Nomogramm sieht man das daran, dass alle Kurven bei Validität 0 in der Basisrate-Linie starten und tiefere SR-Kurven steiler ansteigen.
Die Rolle der Basisrate
Der maximale Spielraum liegt bei mittlerer Basisrate (≈ .50). Ist die Basisrate sehr hoch (fast alle geeignet), kann ein Test kaum verbessern — man läge ohnehin richtig. Ist sie sehr niedrig, ist absolute Verbesserung schwer, aber die relative kann groß sein. Stell die Basisrate auf .20 vs. .80 und beobachte, wie sich die ganze Tafel und das Nomogramm verschieben.
Erfolgsquote = positiver prädiktiver Wert
Die Taylor-Russell-Erfolgsquote ist nichts anderes als der PPV: unter den als „geeignet" Ausgewählten der Anteil, der das Kriterium tatsächlich erfüllt. Damit ist das Tool das stetige Gegenstück zur Vierfeldertafel aus Sensitivität/Spezifität — nur über kontinuierliche bivariate Normalverteilung statt diskreter Klassifikation. → Sensitivität & Spezifität
Bezug: Range Restriction
Wichtig: die ρ, die hier eingesetzt wird, muss die wahre Validität in der Bewerberpopulation sein. Validitätsstudien werden aber oft an bereits Ausgewählten durchgeführt → die beobachtete Korrelation ist durch Range Restriction nach unten verzerrt. Wer den unkorrigierten Wert einsetzt, unterschätzt den Nutzen systematisch. Erst Thorndike-korrigieren, dann in die Taylor-Russell-Tafel. → Range Restriction (Varianzeinschränkung)
Bezug: Diagnostische Validität
Taylor-Russell ist ein Baustein der Nutzenbetrachtung von Auswahlverfahren. Das Tool Diagnostische Validität ordnet es in Konstrukt-, Kriteriums- und Inhaltsvalidität ein und zeigt die Brücke zur Nutzenwert-Analyse (Brogden-Cronbach-Gleser), die den Selektionsnutzen zusätzlich in Geldeinheiten ausdrückt. → Diagnostische Validität
Grenzen & Annahmen
Die Tafel unterstellt (1) bivariate Normalverteilung von Prädiktor und Kriterium, (2) ein dichotomes Erfolgskriterium (geeignet/ungeeignet per Cutoff), (3) lineare Beziehung und konstante Streuung (Homoskedastizität). Reale Kriterien sind oft schief oder mehrstufig; dann sind die Werte Näherungen. Für stetige Nutzenmaße ohne künstlichen Kriteriums-Cutoff eignet sich das Brogden-Cronbach-Gleser-Modell.
Tafel vs. Nomogramm
Die klassische gedruckte Tafel ist eine diskrete Stützstellen-Matrix — praktisch zum Nachschlagen. Das Nomogramm macht sichtbar, dass dahinter eine glatte Fläche EQ(ρ, SR, BR) steckt: jede Tafelzelle ist nur ein Punkt auf einer Kurve. Das Zielkreuz erlaubt das stufenlose Ablesen zwischen den Tafelzeilen — und zeigt, dass Interpolation in der gedruckten Tafel zulässig ist.