Simpson's Paradox — wenn der Trend die Richtung wechselt
Dr. R. Düsing · Universität Osnabrück
Szenario
Effekt innerhalb der Gruppen
Within-Slope bw+0.7
Konfundierung (Gruppen)
Zwischen-Trend bb−1.3
Gruppen-Versatz0.80
Stichprobe
Gruppen3
n pro Gruppe40
Streuung (Rauschen)6
Anzeige
Within-Geraden
Pooled-Gerade
📋 Beispiel — Behandlungsdosis & Genesung
Innerhalb jeder Krankheitsschwere-Gruppe gilt: höhere Dosis → bessere Genesung (die farbigen Geraden steigen).
Aber schwerere Gruppen bekommen mehr Dosis und genesen schlechter. Ignoriert man die Gruppen, scheint die
gepoolte Gerade plötzlich zu sagen: mehr Dosis → schlechtere Genesung. Derselbe Datensatz, gegenteilige
Botschaft — das ist Simpson's Paradox. Es entsteht durch eine Konfundierungsvariable (hier: Schweregrad).
① Vorzeichen-Check
Within-Slope (gruppiert)
—
Mittel der Gruppen-Geraden
Pooled-Slope (aggregiert)
—
Regression ohne Gruppen
Pooled-Korrelation r
—
über alle Punkte
—
② Streudiagramm — Within vs. Pooled
Farbige Geraden = innerhalb der Gruppen · rote Gerade = gepoolt (Gruppen ignoriert)
Konzepte
Was ist Simpson's Paradox?
Ein Zusammenhang, der in jeder Teilgruppe in eine Richtung zeigt, kann sich
umkehren, sobald man die Gruppen zusammenwirft. Ursache ist fast immer eine Konfundierungsvariable,
die sowohl mit dem Prädiktor als auch mit dem Outcome zusammenhängt und über die Gruppen ungleich verteilt ist.
Berkeley-Zulassungen (1973)
Das berühmteste Beispiel: Frauen wurden insgesamt seltener zugelassen — aber in fast jedem
einzelnen Fachbereich gleich oft oder häufiger. Frauen bewarben sich nur öfter in Fächern mit niedriger
Zulassungsquote. Der Fachbereich war der Confounder.
Ökologischer Fehlschluss
Der Schluss von Gruppen- auf Individualebene (oder umgekehrt) ist nicht zulässig. Simpson's
Paradox ist der Extremfall: Der aggregierte Trend sagt sogar das Gegenteil des
individuellen aus. Welche Ebene „richtig" ist, entscheidet die kausale Frage, nicht die Statistik.
Bezug zu Multilevel-Modellen
Genau hier setzt Partial Pooling an: Ein Multilevel-Modell trennt den
Within- vom Between-Effekt, statt beide zu vermischen wie die gepoolte Regression. Wer Gruppenstruktur ignoriert
(Complete Pooling), riskiert Simpson.
→ Zum Multilevel-Tool
Simpson's Paradox — Hintergrund
Das Phänomen
Ein statistischer Zusammenhang kann in jeder Teilgruppe positiv sein und trotzdem negativ werden,
wenn man die Gruppen zusammenfasst (oder umgekehrt). Benannt nach Edward H. Simpson (1951), beschrieben aber schon
von Pearson, Yule und Kendall. Es ist kein Rechenfehler — beide Trends sind real, sie beantworten nur
verschiedene Fragen.
Warum passiert das?
Die gepoolte (aggregierte) Steigung vermischt zwei Quellen von Kovarianz: die Within-Gruppen-Variation
und die Between-Gruppen-Variation. Sind die Gruppen entlang einer gegenläufigen Richtung verschoben
(Konfundierung), kann der Between-Anteil den Within-Anteil überstimmen:
Ist bwithin positiv, aber bbetween stark negativ und die Gruppen
weit auseinander (großer Gruppen-Versatz → großes Var_between), dominiert der zweite Term und bpooled
wird negativ. Genau dann kippt das Vorzeichen.
Die Regler
Within-Slope bw: der wahre Effekt innerhalb jeder Gruppe. Zwischen-Trend bb: wie die Gruppen-Mittelpunkte angeordnet sind (Richtung & Stärke der Konfundierung). Gruppen-Versatz: wie weit die Gruppen voneinander getrennt sind. Bei 0 überlappen sie vollständig →
pooled = within, kein Paradox. Je größer, desto stärker dominiert der Between-Trend.
Drei Szenarien
Umkehr: Within positiv, Between negativ → Pooled negativ (klassisches Paradox). Keine Konfundierung: Gruppen-Versatz = 0 → Within und Pooled stimmen überein. Verstärkung: Within und Between gleiches Vorzeichen → Pooled übertreibt den Effekt
(gleiche Richtung, falsche Größe). Auch das ist eine Form der Verzerrung.
Was tun?
Die Lösung ist nicht „immer aufschlüsseln" oder „immer poolen", sondern die kausale Struktur
zu klären (DAG): Ist die Gruppenvariable ein Confounder, muss man für sie adjustieren (within betrachten).
Ist sie ein Mediator auf dem Wirkpfad, würde Adjustieren den Effekt fälschlich wegrechnen. Ein
Multilevel-Modell (Partial Pooling) trennt Within- und Between-Effekt sauber.
Literatur
Simpson, E. H. (1951). The interpretation of interaction in contingency tables. JRSS B, 13(2), 238–241.
Bickel, P. J., Hammel, E. A. & O'Connell, J. W. (1975). Sex bias in graduate admissions: Data from Berkeley. Science, 187, 398–404.
Pearl, J. (2014). Comment: Understanding Simpson's paradox. The American Statistician, 68(1), 8–13.