Propensity Score Matching & Weighting

①

Das Problem — Selektionsbias & Propensity Score

Behandelte und Kontrollen unterscheiden sich in Vormerkmalen (X₁–X₃). Der Propensity Score e(X) = P(T=1|X) verdichtet alle Kovariaten zu einem Skalar — und zeigt, wo die Gruppen überlappen (Common Support). Ohne Überlappung ist kein Matching möglich.

Wird berechnet…

②

Die Korrektur — Kovariaten-Balance

Der Love Plot zeigt den Standardisierten Mittleren Unterschied (SMD) je Kovariate vor und nach Adjustierung. Ziel: alle |SMD| < 0,10 (grüne Zone). Ein ausgeglichener Love Plot bedeutet: die Gruppen sind nach Adjustierung vergleichbar.

Kovariate	SMD vorher	SMD Matching	SMD IPW

③

Der Effekt — Kausale Schätzung

Der grüne Strich markiert den wahren Effekt τ (im Simulationsmodell bekannt). Wie nah kommen die Schätzer heran? Der naive Vergleich zeigt den Bias — adjustierte Methoden sollten sich der Wahrheitslinie annähern.

Lernkarten

Was ist ein Propensity Score?

e(X) = P(T=1|X) — die bedingte Behandlungswahrscheinlichkeit. Rosenbaum & Rubin (1983): Wenn Y(0),Y(1) ⊥ T | X, dann auch Y(0),Y(1) ⊥ T | e(X). Mächtige Dimensionsreduktion: k Kovariaten → 1 Skalar. Wird meist via logistischer Regression geschätzt.

Selektionsbias & CIA

PSM/IPW setzt Ignorabilität (CIA) voraus: bedingt auf X ist T unabhängig von Y(0),Y(1). Das eliminiert Bias durch gemessene Kovariaten. Ungemessene Confounder verursachen weiterhin Bias — PSM/IPW ist kein Allheilmittel.

1:1 Nearest-Neighbor Matching

Jeder behandelten Person wird die Kontrollperson mit dem nächsten PS zugeordnet (ohne Zurücklegen). Das Caliper c begrenzt die maximale Distanz. Empfehlung: c = 0,2 · SD(logit(PS)). Ohne Caliper: garantiert ein Match, aber evtl. schlechte Qualität.

Common Support

Nur im Überlappungsbereich der PS-Verteilungen ist Schätzung valide. Behandelte mit PS ≈ 1 haben keine ähnlichen Kontrollen — sie werden beim Matching ausgeschlossen. Bei IPW bekommen diese Einheiten extreme Gewichte (w → ∞) — Clipping oder stabilisierte Gewichte nötig.

IPW für ATT

Behandelte: w = 1 · Kontrollen: w = e(X)/(1−e(X)). Kontrollen mit hohem PS (die eigentlich hätten teilnehmen können) erhalten mehr Gewicht. Resultat: pseudo-randomisierte Stichprobe. Effizienter als Matching, sensitiver bei extremen PS-Werten.

Love Plot & SMD

SMD = (μ_T − μ_K) / SD_gepooled. |SMD| < 0,10 → gute Balance · < 0,25 → akzeptabel. Der Love Plot zeigt Balance für alle Kovariaten simultan — vor und nach Adjustierung. Balance gilt nur für gemessene Variablen.

Propensity Score — Matching & Weighting