Sensitivität & Spezifität

Durchgehendes Beispiel

TGoldstandard: ADHS-Diagnose nach klinischem Interview (DSM-5) XTest: Testwert eines Eltern-Screeninginstruments cCut-Off: Testwert-Schwelle für die Screeningentscheidung ADHS+Merkmalsträger: leicht erhöhte Testwerte ADHS−Nicht-Merkmalsträger: unauffällige Testwerte

Ab welchem Testwert sollte ein Screening positiv ausfallen — und wie viele Kinder gehen dadurch verloren (FN) vs. wie viele werden unnötig weiterverwiesen (FP)? Verteilungsüberlappung, Prävalenz und Fehlerkosten bestimmen den optimalen Cut-Off.

① Verteilungsplot

② Vierfeldertafel & Kennwerte

	Test +	Test −	Σ
Krit. ADHS+	TPrichtig positiv—	FNfalsch negativ—	—
Krit. ADHS−	FPfalsch positiv—	TNrichtig negativ—	—
Σ	—	—	—

Kennwert	Formel	Berechnung	Wert

③ ROC-Analyse

Optimaler Cut-Off

Konzepte

Sensitivität vs. Spezifität — der Trade-off

Sensitivität (SE) = TP / (TP + FN) — Anteil der Kranken, der korrekt als positiv erkannt wird (wenige verpasste Fälle, FN). Spezifität (SP) = TN / (TN + FP) — Anteil der Gesunden, der korrekt ausgeschlossen wird (wenige Fehlalarme, FP). Bei überlappenden Verteilungen ist beides zugleich nicht maximierbar: ein niedrigerer Cut-Off hebt SE und senkt SP — und umgekehrt. Welche Seite wichtiger ist, entscheiden die klinischen Konsequenzen.

ROC-Kurve & AUC

Die ROC-Kurve trägt Sensitivität gegen 1−Spezifität für alle Cut-Offs auf. Ein perfekter Test läuft durch die linke obere Ecke (0,1), reines Raten entspricht der Diagonalen. Die AUC fasst die Trennschärfe cut-off-unabhängig in einer Zahl zusammen (0.5 = Zufall, 1.0 = perfekt). Je weiter die Verteilungen auseinanderliegen und je schmaler sie sind, desto höher die AUC.

Prädiktive Werte & Prävalenz

PPV = TP / (TP + FP) und NPV = TN / (TN + FN) beantworten die Frage für die konkrete Person: Wie verlässlich ist ein positiver bzw. negativer Befund? Sie hängen — anders als SE und SP — stark von der Prävalenz ab: Bei seltener Störung wird der PPV selbst bei gutem Test niedrig, weil unter vielen Gesunden schon wenige Prozent Fehlalarme (FP) die wenigen echten Fälle überwiegen. Prävalenzform: PPV = (SE·Präv) / (SE·Präv + (1−SP)·(1−Präv)).

Likelihood Ratios

LR+ = SE/(1−SP) und LR− = SP/(1−SE) sind prävalenzunabhängige Maße der Trennschärfe. Sie sind hier bewusst so definiert, dass bei beiden je höher, desto besser gilt: LR+ stützt die Diagnose bei positivem, LR− schließt sie aus bei negativem Befund. Die in vielen Quellen übliche Variante LR− = (1−SE)/SP ist der Kehrwert — nötig zur Umrechnung in Odds (Post-Odds = Prä-Odds · LR), aber interpretativ weniger eingängig (dort gilt „je kleiner, desto besser"). Achte deshalb immer auf die verwendete Definition.

Den Cut-Off wählen

Es gibt nicht den richtigen Cut-Off — er folgt aus dem Ziel: Youden-Index (max SE+SP−1, gleichgewichtet), Kosten-Nutzen (eine Fehlerart teurer → Cut-Off verschieben), Missklassifikationskosten (prävalenzgewichteter Gesamtfehler) oder prädiktiv (max PPV/NPV). Probier die Methoden im ROC-Panel durch und übernimm den Cut-Off.

Eigenschaft vs. Nutzen

SE und SP sind Eigenschaften des Tests — prävalenzunabhängig und auf andere Populationen übertragbar. PPV/NPV sind dagegen situationsabhängig. In Selektionssituationen heißt der PPV Erfolgsquote — dieselbe Größe, anderes Anwendungsfeld. → Diagnostische Validität · → Taylor-Russell-Tafeln

Sensitivität & Spezifität — Diagnostische Kennwerte