Normierungsverzerrung — T-Werte bei schiefen Verteilungen
Dr. R. Düsing · Universität Osnabrück
Verteilungstyp
Typisch für Symptomskalen: Mode < Median < Mittelwert, parametrische Schiefe über Shape α kontrollierbar.
Parameter
Verteilungskennwerte
Mittelwert—
SD—
Schiefe γ₁—
T-Wert → Echter PR
Anzeigebereich (beide Canvas)
0 bis40 Pkt.
📋 Einleitung — SCL-90-R als Beispiel
Die SCL-90-R (Items 0–4, hier 10 Items → Summenwert 0–40) hat eine stark rechtsschiefe Normierungsverteilung.
Die Autoren haben dies korrekt gelöst und die T-Werte über die Flächentransformation (Lienert & Raatz) berechnet — also percentiläquivalent.
Dieses Tool stellt die Gegenfrage: Wie stark wäre die Verzerrung, wenn man stattdessen lineare T-Werte (M=50, SD=10) verwendet hätte?
Ein lineares T=50 läge empirisch bei … der Normstichprobe.
① Dichteverteilung — Empirisch (blau) vs. implizierte Normalverteilung (orange)
② Diskrepanztabelle — Vergleich beider Normierungsansätze
T (linear)
Rohwert
T-Norm PR
Empir. PR
Diff (PP)
T_F (Fläche)
Δ T
T (linear) = 50 + 10·(x − M̄)/SD — setzt Normalverteilung vorausT-Norm PR = nominaler Prozentrang unter NV-AnnahmeEmpir. PR = wahrer Prozentrang in der simulierten VerteilungDiff (PP) = Empir. PR − T-Norm PR in ProzentpunktenT_F (Fläche) = 50 + 10·Φ⁻¹(Empir. PR / 100) — Lienert & RaatzΔ T = T_F − T (linear): positiv = lineare Norm unterschätzt Elevation
③ Prozentrang-Kurven im Vergleich
Kumulierte Prozentränge: Empirisch (blau) vs. T-Norm-Annahme (orange)
Die Divergenz zwischen den Kurven zeigt, wie stark die T-Norm den empirischen PR unter- oder überschätzt.
Konzepte
Das Normierungsdilemma
Lineare T-Werte setzen voraus, dass die Normierungsstichprobe normalverteilt ist.
Bei schiefen Rohdaten (z.B. Symptomskalen) ist diese Voraussetzung verletzt.
Der T-Wert-Mittelwert (T=50) fällt dann nicht auf den 50. Perzentrang der Population,
sondern auf einen deutlich höheren.
Warum PR(Mittelwert) > 50 %?
Bei rechtsschiefen Verteilungen liegt mehr als die Hälfte aller Werte unterhalb des Mittelwerts
(Mittelwert > Median). Der T-Wert normiert auf den Mittelwert — aber empirisch übertrifft dieser
Wert 60–75 % der Normstichprobe. Ein Patient mit T=50 ist damit pathologischer als PR=50 suggeriert.
Wo liegt die größte Verzerrung?
Die Abweichung ist im mittleren Bereich (T=45–65) am größten,
weil dort die Schiefe der Verteilung den CDF am stärksten gegenüber der Normalverteilung verschiebt.
Bei extremen Werten (T=70–80) ist die Diskrepanz gering — beide Kurven nähern sich 100 %.
Klinisch brisant: gerade milde bis moderate Symptomwerte werden fehlklassifiziert.
Alternativen: Flächentreue Normierung
Die area transformation (Watts & Bollen, 1985; Blom, 1958) weist
jedem Rohwert seinen empirischen Perzentrang zu und transformiert diesen dann in einen Normalwert.
Das Ergebnis entspricht dem, was man erhalten würde, wenn die Rohwerte normalverteilt wären —
ohne die Normalverteilungsannahme zu verletzen. Gebräuchliche Varianten: Rangnormierung, Blom-Korrektur.
Normierungsverzerrung — Hilfe & Hintergrund
Das Problem
Viele psychologische Tests (SCL-90-R, BDI, PHQ-9, BAI) erheben Symptomwerte auf ordinalen Skalen (z.B. 0–4).
Summenwerte über mehrere Items sind in gesunden Normierungsstichproben stark rechtschief:
Die meisten Menschen haben niedrige Werte, wenige haben hohe.
Obwohl diese Verteilung nicht normalverteilt ist, werden häufig lineare T-Werte berechnet:
T = 50 + 10 · (X − M) / SD
Diese Transformation setzt implizit voraus, dass X normalverteilt ist. Das führt zu systematischen Verzerrungen.
Was dieses Tool zeigt
Vier rechtsschiefe Verteilungstypen können auf 0–40 skalierte Rohwerte angepasst werden.
Das Tool vergleicht für jeden Rohwert den T-Norm-impliziten Prozentrang (unter Normalverteilungsannahme)
mit dem echten empirischen Prozentrang aus der gewählten Verteilung.
Die vier Verteilungstypen
Gamma (α, β): Hier wird die Raten-Parametrisierung verwendet (wie in R: dgamma(x, shape=α, rate=β)).
Shape α bestimmt die Form und Schiefe: Schiefe = 2/√α.
Für α < 1 ist die Verteilung extrem rechtschief (monoton fallend), für α → ∞ nähert sie sich der Normalverteilung.
Rate β ist der reziproke Skalierungsparameter (β = 1/Scale): er staucht (großes β) oder streckt (kleines β) die Verteilung.
Mittelwert M = α/β, Varianz σ² = α/β², PDF: f(x) = β^α · x^(α−1) · e^(−βx) / Γ(α).
Beispiel: α=1.5, β=0.20 → M=7.5, SD=6.1, γ₁=1.63 — typisch für gesunde SCL-90-Normstichprobe (10 Items, Bereich 0–40).
Praktisch: α kontrolliert die Asymmetrie, β die Lage (umgekehrt proportional zum Mittelwert).
Log-Normal (μ_log, σ_log): Ergibt sich, wenn der Logarithmus des Messwerts normalverteilt ist.
Schiefe steigt schnell mit σ_log. Häufig bei Messwerten, die nicht negativ werden können.
Exponential (λ): Spezialfall der Gamma-Verteilung (α=1). Gedächtnisloser Prozess,
maximale Schiefe = 2. Alle Rohwerte gleich wahrscheinlich zu verringern — extremes Modell.
Weibull (k, λ): Zweiparametrische Verteilung, die je nach Shape-Parameter k sehr unterschiedliche Formen annimmt.
k < 1: streng monoton fallend, fallende Hazardrate (wie Exponential, aber noch extremer).
k = 1: identisch mit Exponential(1/λ).
1 < k < 3.6: rechtschief, glockenförmig — relevant für Überlebenszeiten und Reaktionszeiten.
k > 3.6: annähernd normalverteilt.
Mittelwert = λ · Γ(1 + 1/k), Varianz = λ² · [Γ(1+2/k) − Γ(1+1/k)²].
Ex-Gaussian (μ, σ, τ): Faltung aus Normalverteilung N(μ,σ²) und Exponential Exp(1/τ).
Häufig für Reaktionszeitdaten. Ermöglicht separate Kontrolle über normalverteilte Grundkomponente
und exponentiellen Ausreißerterm (τ). Schiefe ≈ 2τ³/(σ²+τ²)^(3/2).
Numerische Implementierung & Grenzen
Exakte CDFs: Für Gamma, Log-Normal, Exponential und Weibull verwendet das Tool analytisch exakte kumulative Verteilungsfunktionen (z.B. regularisierte unvollständige Gammafunktion), die keine Diskretisierungsfehler nahe x=0 aufweisen. Nur für die Ex-Gauss-Verteilung wird numerisch integriert (Trapezregel, 1200 Schritte).
Kontinuierliche Näherung: Das Tool modelliert alle Verteilungen als stetig. In der diagnostischen Praxis (z.B. SCL-90-R) ist der Rohwert 0 oft ein diskreter Block mit massiver punktueller Wahrscheinlichkeit (Bodeneffekt). Diese Klippenwahrscheinlichkeit bei x=0 wird vom Tool nicht dargestellt — es zeigt das kontinuierliche Modell als Idealisierung.
Dabei ist M̄ der Mittelwert und SD die Standardabweichung der empirischen Verteilung —
die gleichen Werte, die für die lineare T-Transformation verwendet werden.
Die Differenz Empir. PR − Nominal PR zeigt die Fehlklassifikation.
Flächentransformation nach Lienert & Raatz
Die flächentreue T-Normierung (Lienert & Raatz, 1998; auch: „area transformation" oder „normalized standard scores") löst das Schiefeproblem, indem sie jeden Rohwert über seinen empirischen Prozentrang in einen T-Wert überführt — nicht über eine lineare Formel:
T_F(x) = 50 + 10 · Φ⁻¹(F_emp(x))
Dabei ist F_emp(x) die empirische kumulative Häufigkeit des Rohwerts x und Φ⁻¹ die Quantilfunktion (Inverse) der Standardnormalverteilung. Das Ergebnis: Wer auf dem 84. Perzentrang der Normstichprobe liegt, bekommt immer T_F = 60 — unabhängig davon, ob die Rohwertverteilung schief ist oder nicht.
Vergleich beider Methoden:
Linear: T = 50 + 10 · (x − M) / SD → setzt Normalvt. voraus
Fläche: T_F = 50 + 10 · Φ⁻¹(F_emp(x)) → exakt nach Prozentrang
Der Toggle „Flächentransf." im Tool blendet drei zusätzliche visuelle Elemente ein:
① Grüne Dichtekurve im ersten Panel: Eine Quantil-basierte Normalapproximation — eine Normalverteilung, deren Parameter robust aus den empirischen Quantilen geschätzt werden: Zentrum = empirischer Median, Streuung = (PR84 − PR16)/2. Wichtig: Das ist nicht die Dichte der Flächentransformation selbst (die im Rohwert-Raum identisch mit der empirischen Dichte wäre), sondern eine heuristische Visualisierung: Sie zeigt, wie eine Normalverteilung aussähe, wenn man robust parametrisiert — und macht so den Unterschied zur linear-normierten orangen Kurve sichtbar.
② Grüne gestrichelte Vertikallinien (T_F = 40, 50, 60, 70) im Dichteplot: Sie markieren genau die Raw-Score-Positionen, die bei flächentreuer Normierung die T-Werte 40, 50, 60, 70 erzeugen — also die empirischen PR-Quantile 15.9 %, 50 %, 84.1 % und 97.7 %. Vergleich mit den roten Linien (linear) zeigt die Verschiebung.
③ Tabellenspalten „T Fläche" und „Δ T": Für jeden linearen T-Wert (T = 30–80) wird der flächentreue T-Wert am gleichen Rohwert berechnet und die Differenz ausgewiesen. Positive Δ T: Die lineare Normierung unterschätzt die klinische Elevation — der Patient ist pathologischer als T_linear suggeriert.
Literatur
Lienert, G.A. & Raatz, U. (1998). Testaufbau und Testanalyse (6. Aufl.). Beltz PVU. [Kap. 7: Normierung]
Franke, G.H. (2002). SCL-90-R. Symptom-Checkliste von L.R. Derogatis (2. Aufl.). Beltz Test.
Blom, G. (1958). Statistical estimates and transformed beta-variables. Almqvist & Wiksell.