Simpson's Paradox — wenn der Trend die Richtung wechselt

Dr. R. Düsing · Universität Osnabrück
📋 Beispiel — Behandlungsdosis & Genesung
Innerhalb jeder Krankheitsschwere-Gruppe gilt: höhere Dosis → bessere Genesung (die farbigen Geraden steigen). Aber schwerere Gruppen bekommen mehr Dosis und genesen schlechter. Ignoriert man die Gruppen, scheint die gepoolte Gerade plötzlich zu sagen: mehr Dosis → schlechtere Genesung. Derselbe Datensatz, gegenteilige Botschaft — das ist Simpson's Paradox. Es entsteht durch eine Konfundierungsvariable (hier: Schweregrad).
① Vorzeichen-Check
Within-Slope (gruppiert)
Mittel der Gruppen-Geraden
Pooled-Slope (aggregiert)
Regression ohne Gruppen
Pooled-Korrelation r
über alle Punkte
② Streudiagramm — Within vs. Pooled
Farbige Geraden = innerhalb der Gruppen · rote Gerade = gepoolt (Gruppen ignoriert)
Konzepte
Was ist Simpson's Paradox?
Ein Zusammenhang, der in jeder Teilgruppe in eine Richtung zeigt, kann sich umkehren, sobald man die Gruppen zusammenwirft. Ursache ist fast immer eine Konfundierungsvariable, die sowohl mit dem Prädiktor als auch mit dem Outcome zusammenhängt und über die Gruppen ungleich verteilt ist.
Berkeley-Zulassungen (1973)
Das berühmteste Beispiel: Frauen wurden insgesamt seltener zugelassen — aber in fast jedem einzelnen Fachbereich gleich oft oder häufiger. Frauen bewarben sich nur öfter in Fächern mit niedriger Zulassungsquote. Der Fachbereich war der Confounder.
Ökologischer Fehlschluss
Der Schluss von Gruppen- auf Individualebene (oder umgekehrt) ist nicht zulässig. Simpson's Paradox ist der Extremfall: Der aggregierte Trend sagt sogar das Gegenteil des individuellen aus. Welche Ebene „richtig" ist, entscheidet die kausale Frage, nicht die Statistik.
Bezug zu Multilevel-Modellen
Genau hier setzt Partial Pooling an: Ein Multilevel-Modell trennt den Within- vom Between-Effekt, statt beide zu vermischen wie die gepoolte Regression. Wer Gruppenstruktur ignoriert (Complete Pooling), riskiert Simpson.
→ Zum Multilevel-Tool
Simpson's Paradox — Hintergrund
Das Phänomen

Ein statistischer Zusammenhang kann in jeder Teilgruppe positiv sein und trotzdem negativ werden, wenn man die Gruppen zusammenfasst (oder umgekehrt). Benannt nach Edward H. Simpson (1951), beschrieben aber schon von Pearson, Yule und Kendall. Es ist kein Rechenfehler — beide Trends sind real, sie beantworten nur verschiedene Fragen.

Warum passiert das?

Die gepoolte (aggregierte) Steigung vermischt zwei Quellen von Kovarianz: die Within-Gruppen-Variation und die Between-Gruppen-Variation. Sind die Gruppen entlang einer gegenläufigen Richtung verschoben (Konfundierung), kann der Between-Anteil den Within-Anteil überstimmen:

b_pooled = [ Cov_within(x,y) + Cov_between(x,y) ] / [ Var_within(x) + Var_between(x) ] Cov_within = b_within · Var_within(x) Cov_between = b_between · Var_between(x)

Ist bwithin positiv, aber bbetween stark negativ und die Gruppen weit auseinander (großer Gruppen-Versatz → großes Var_between), dominiert der zweite Term und bpooled wird negativ. Genau dann kippt das Vorzeichen.

Die Regler

Within-Slope bw: der wahre Effekt innerhalb jeder Gruppe.
Zwischen-Trend bb: wie die Gruppen-Mittelpunkte angeordnet sind (Richtung & Stärke der Konfundierung).
Gruppen-Versatz: wie weit die Gruppen voneinander getrennt sind. Bei 0 überlappen sie vollständig → pooled = within, kein Paradox. Je größer, desto stärker dominiert der Between-Trend.

Drei Szenarien

Umkehr: Within positiv, Between negativ → Pooled negativ (klassisches Paradox).
Keine Konfundierung: Gruppen-Versatz = 0 → Within und Pooled stimmen überein.
Verstärkung: Within und Between gleiches Vorzeichen → Pooled übertreibt den Effekt (gleiche Richtung, falsche Größe). Auch das ist eine Form der Verzerrung.

Was tun?

Die Lösung ist nicht „immer aufschlüsseln" oder „immer poolen", sondern die kausale Struktur zu klären (DAG): Ist die Gruppenvariable ein Confounder, muss man für sie adjustieren (within betrachten). Ist sie ein Mediator auf dem Wirkpfad, würde Adjustieren den Effekt fälschlich wegrechnen. Ein Multilevel-Modell (Partial Pooling) trennt Within- und Between-Effekt sauber.

Literatur

Simpson, E. H. (1951). The interpretation of interaction in contingency tables. JRSS B, 13(2), 238–241.
Bickel, P. J., Hammel, E. A. & O'Connell, J. W. (1975). Sex bias in graduate admissions: Data from Berkeley. Science, 187, 398–404.
Pearl, J. (2014). Comment: Understanding Simpson's paradox. The American Statistician, 68(1), 8–13.