Normierungsverzerrung — T-Werte bei schiefen Verteilungen

Dr. R. Düsing · Universität Osnabrück
📋 Einleitung — SCL-90-R als Beispiel
Die SCL-90-R (Items 0–4, hier 10 Items → Summenwert 0–40) hat eine stark rechtsschiefe Normierungsverteilung. Die Autoren haben dies korrekt gelöst und die T-Werte über die Flächentransformation (Lienert & Raatz) berechnet — also percentiläquivalent. Dieses Tool stellt die Gegenfrage: Wie stark wäre die Verzerrung, wenn man stattdessen lineare T-Werte (M=50, SD=10) verwendet hätte? Ein lineares T=50 läge empirisch bei der Normstichprobe.
① Dichteverteilung — Empirisch (blau) vs. implizierte Normalverteilung (orange)
Rote Linien = lineare T-Wert-Stufen · Blaue Linien = empirische Percentile (PR 16, 50, 84, 98) · Grün (Toggle) = T_F-Stufen + NV (Median/IQR) · Modell: kontinuierlich — Bodeneffekt bei x=0 nicht abgebildet
② Diskrepanztabelle — Vergleich beider Normierungsansätze
T (linear) Rohwert T-Norm PR Empir. PR Diff (PP) T_F (Fläche) Δ T
T (linear) = 50 + 10·(x − M̄)/SD  —  setzt Normalverteilung voraus T-Norm PR = nominaler Prozentrang unter NV-Annahme Empir. PR = wahrer Prozentrang in der simulierten Verteilung Diff (PP) = Empir. PR − T-Norm PR in Prozentpunkten T_F (Fläche) = 50 + 10·Φ⁻¹(Empir. PR / 100)  —  Lienert & Raatz Δ T = T_F − T (linear): positiv = lineare Norm unterschätzt Elevation
③ Prozentrang-Kurven im Vergleich
Kumulierte Prozentränge: Empirisch (blau) vs. T-Norm-Annahme (orange)
Die Divergenz zwischen den Kurven zeigt, wie stark die T-Norm den empirischen PR unter- oder überschätzt.
Konzepte
Das Normierungsdilemma
Lineare T-Werte setzen voraus, dass die Normierungsstichprobe normalverteilt ist. Bei schiefen Rohdaten (z.B. Symptomskalen) ist diese Voraussetzung verletzt. Der T-Wert-Mittelwert (T=50) fällt dann nicht auf den 50. Perzentrang der Population, sondern auf einen deutlich höheren.
Warum PR(Mittelwert) > 50 %?
Bei rechtsschiefen Verteilungen liegt mehr als die Hälfte aller Werte unterhalb des Mittelwerts (Mittelwert > Median). Der T-Wert normiert auf den Mittelwert — aber empirisch übertrifft dieser Wert 60–75 % der Normstichprobe. Ein Patient mit T=50 ist damit pathologischer als PR=50 suggeriert.
Wo liegt die größte Verzerrung?
Die Abweichung ist im mittleren Bereich (T=45–65) am größten, weil dort die Schiefe der Verteilung den CDF am stärksten gegenüber der Normalverteilung verschiebt. Bei extremen Werten (T=70–80) ist die Diskrepanz gering — beide Kurven nähern sich 100 %. Klinisch brisant: gerade milde bis moderate Symptomwerte werden fehlklassifiziert.
Alternativen: Flächentreue Normierung
Die area transformation (Watts & Bollen, 1985; Blom, 1958) weist jedem Rohwert seinen empirischen Perzentrang zu und transformiert diesen dann in einen Normalwert. Das Ergebnis entspricht dem, was man erhalten würde, wenn die Rohwerte normalverteilt wären — ohne die Normalverteilungsannahme zu verletzen. Gebräuchliche Varianten: Rangnormierung, Blom-Korrektur.
Normierungsverzerrung — Hilfe & Hintergrund
Das Problem

Viele psychologische Tests (SCL-90-R, BDI, PHQ-9, BAI) erheben Symptomwerte auf ordinalen Skalen (z.B. 0–4). Summenwerte über mehrere Items sind in gesunden Normierungsstichproben stark rechtschief: Die meisten Menschen haben niedrige Werte, wenige haben hohe. Obwohl diese Verteilung nicht normalverteilt ist, werden häufig lineare T-Werte berechnet:

T = 50 + 10 · (X − M) / SD

Diese Transformation setzt implizit voraus, dass X normalverteilt ist. Das führt zu systematischen Verzerrungen.

Was dieses Tool zeigt

Vier rechtsschiefe Verteilungstypen können auf 0–40 skalierte Rohwerte angepasst werden. Das Tool vergleicht für jeden Rohwert den T-Norm-impliziten Prozentrang (unter Normalverteilungsannahme) mit dem echten empirischen Prozentrang aus der gewählten Verteilung.

Die vier Verteilungstypen

Gamma (α, β): Hier wird die Raten-Parametrisierung verwendet (wie in R: dgamma(x, shape=α, rate=β)). Shape α bestimmt die Form und Schiefe: Schiefe = 2/√α. Für α < 1 ist die Verteilung extrem rechtschief (monoton fallend), für α → ∞ nähert sie sich der Normalverteilung. Rate β ist der reziproke Skalierungsparameter (β = 1/Scale): er staucht (großes β) oder streckt (kleines β) die Verteilung. Mittelwert M = α/β, Varianz σ² = α/β², PDF: f(x) = β^α · x^(α−1) · e^(−βx) / Γ(α). Beispiel: α=1.5, β=0.20 → M=7.5, SD=6.1, γ₁=1.63 — typisch für gesunde SCL-90-Normstichprobe (10 Items, Bereich 0–40). Praktisch: α kontrolliert die Asymmetrie, β die Lage (umgekehrt proportional zum Mittelwert).

Log-Normal (μ_log, σ_log): Ergibt sich, wenn der Logarithmus des Messwerts normalverteilt ist. Schiefe steigt schnell mit σ_log. Häufig bei Messwerten, die nicht negativ werden können.

Exponential (λ): Spezialfall der Gamma-Verteilung (α=1). Gedächtnisloser Prozess, maximale Schiefe = 2. Alle Rohwerte gleich wahrscheinlich zu verringern — extremes Modell.

Weibull (k, λ): Zweiparametrische Verteilung, die je nach Shape-Parameter k sehr unterschiedliche Formen annimmt. k < 1: streng monoton fallend, fallende Hazardrate (wie Exponential, aber noch extremer). k = 1: identisch mit Exponential(1/λ). 1 < k < 3.6: rechtschief, glockenförmig — relevant für Überlebenszeiten und Reaktionszeiten. k > 3.6: annähernd normalverteilt. Mittelwert = λ · Γ(1 + 1/k), Varianz = λ² · [Γ(1+2/k) − Γ(1+1/k)²].

Ex-Gaussian (μ, σ, τ): Faltung aus Normalverteilung N(μ,σ²) und Exponential Exp(1/τ). Häufig für Reaktionszeitdaten. Ermöglicht separate Kontrolle über normalverteilte Grundkomponente und exponentiellen Ausreißerterm (τ). Schiefe ≈ 2τ³/(σ²+τ²)^(3/2).

Numerische Implementierung & Grenzen

Exakte CDFs: Für Gamma, Log-Normal, Exponential und Weibull verwendet das Tool analytisch exakte kumulative Verteilungsfunktionen (z.B. regularisierte unvollständige Gammafunktion), die keine Diskretisierungsfehler nahe x=0 aufweisen. Nur für die Ex-Gauss-Verteilung wird numerisch integriert (Trapezregel, 1200 Schritte).

Kontinuierliche Näherung: Das Tool modelliert alle Verteilungen als stetig. In der diagnostischen Praxis (z.B. SCL-90-R) ist der Rohwert 0 oft ein diskreter Block mit massiver punktueller Wahrscheinlichkeit (Bodeneffekt). Diese Klippenwahrscheinlichkeit bei x=0 wird vom Tool nicht dargestellt — es zeigt das kontinuierliche Modell als Idealisierung.

Formel: T-Norm PR vs. empirischer PR
Nominaler PR(x) = Φ((x − M̄) / SD) [T-Norm-Annahme: Normalverteilung] Empirischer PR(x) = F_skief(x) [wahre kumulative Verteilungsfunktion]

Dabei ist M̄ der Mittelwert und SD die Standardabweichung der empirischen Verteilung — die gleichen Werte, die für die lineare T-Transformation verwendet werden. Die Differenz Empir. PR − Nominal PR zeigt die Fehlklassifikation.

Flächentransformation nach Lienert & Raatz

Die flächentreue T-Normierung (Lienert & Raatz, 1998; auch: „area transformation" oder „normalized standard scores") löst das Schiefeproblem, indem sie jeden Rohwert über seinen empirischen Prozentrang in einen T-Wert überführt — nicht über eine lineare Formel:

T_F(x) = 50 + 10 · Φ⁻¹(F_emp(x))

Dabei ist F_emp(x) die empirische kumulative Häufigkeit des Rohwerts x und Φ⁻¹ die Quantilfunktion (Inverse) der Standardnormalverteilung. Das Ergebnis: Wer auf dem 84. Perzentrang der Normstichprobe liegt, bekommt immer T_F = 60 — unabhängig davon, ob die Rohwertverteilung schief ist oder nicht.

Vergleich beider Methoden:

Linear: T = 50 + 10 · (x − M) / SD → setzt Normalvt. voraus Fläche: T_F = 50 + 10 · Φ⁻¹(F_emp(x)) → exakt nach Prozentrang

Der Toggle „Flächentransf." im Tool blendet drei zusätzliche visuelle Elemente ein:

Grüne Dichtekurve im ersten Panel: Eine Quantil-basierte Normalapproximation — eine Normalverteilung, deren Parameter robust aus den empirischen Quantilen geschätzt werden: Zentrum = empirischer Median, Streuung = (PR84 − PR16)/2. Wichtig: Das ist nicht die Dichte der Flächentransformation selbst (die im Rohwert-Raum identisch mit der empirischen Dichte wäre), sondern eine heuristische Visualisierung: Sie zeigt, wie eine Normalverteilung aussähe, wenn man robust parametrisiert — und macht so den Unterschied zur linear-normierten orangen Kurve sichtbar.

Grüne gestrichelte Vertikallinien (T_F = 40, 50, 60, 70) im Dichteplot: Sie markieren genau die Raw-Score-Positionen, die bei flächentreuer Normierung die T-Werte 40, 50, 60, 70 erzeugen — also die empirischen PR-Quantile 15.9 %, 50 %, 84.1 % und 97.7 %. Vergleich mit den roten Linien (linear) zeigt die Verschiebung.

Tabellenspalten „T Fläche" und „Δ T": Für jeden linearen T-Wert (T = 30–80) wird der flächentreue T-Wert am gleichen Rohwert berechnet und die Differenz ausgewiesen. Positive Δ T: Die lineare Normierung unterschätzt die klinische Elevation — der Patient ist pathologischer als T_linear suggeriert.

Literatur

Lienert, G.A. & Raatz, U. (1998). Testaufbau und Testanalyse (6. Aufl.). Beltz PVU. [Kap. 7: Normierung]
Franke, G.H. (2002). SCL-90-R. Symptom-Checkliste von L.R. Derogatis (2. Aufl.). Beltz Test.
Blom, G. (1958). Statistical estimates and transformed beta-variables. Almqvist & Wiksell.