Regression Discontinuity Design

Durchgehendes Beispiel

XQualifikationstest-Score (Quasi-Zuweisungsvariable, 0–100 Punkte) cCutoff = 50 — wer ≥ 50 erreicht, wird zum Weiterbildungsprogramm zugelassen TProgrammzulassung (T=1 wenn X ≥ c, sonst T=0) YBruttogehalt 2 Jahre nach Programmstart (skaliert 0–100, messbar für alle Bewerber)

Erhöht die Weiterbildung das Gehalt kausal — oder verdienen leistungsstärkere Bewerber ohnehin mehr? Knapp über und unter dem Cutoff sollten sich Bewerber nur zufällig unterscheiden: genau das nutzt das RDD aus.

① Streudiagramm

② Regressionsgleichung

③ Koeffizienten

▶ Erweiterung — Polynomiale Terme (Grad 2)

Polynomiale RDD

Ist die wahre Beziehung zwischen QAV und Outcome nicht-linear, kann das die LATE-Schätzung verzerren. Durch Hinzufügen polynomialer Terme wird die Kurvenform flexibler modelliert:

ŷ = b₀ + b₁·(X−c) + b₂·T + b₃·(X−c)·T + b₄·(X−c)² + b₅·T·(X−c)² b₄ kontrolliert die Krümmung der KG-Linie.
b₅ gibt die Krümmungsdifferenz EG−KG an (Slope EG-Kurve = b₄ + b₅).

Achtung: Zu hohe Polynomgrade können zu Overfitting führen und den LATE künstlich verzerren — besonders an den Rändern der Datenverteilung.

b₄ (Krümmung KG) 0.000

b₅ (Krümmungs-Diff.) 0.000

▶ Erweiterung — Fuzzy RDD

Fuzzy RDD — Wenn die Grenze „verwischt"

Beim Sharp RDD folgt die Behandlungszuteilung deterministisch dem Cutoff.
Beim Fuzzy RDD gibt es zwei Formen von Nicht-Compliance:

Non-Compliance (EG): Personen über dem Cutoff nehmen die Intervention nicht an.
Crossover (KG): Personen unter dem Cutoff erhalten die Intervention trotzdem.

Der Cutoff wird dann als Instrument (Z) für die tatsächliche Behandlung (T) verwendet. Der LATE ergibt sich als Wald-Schätzer:

LATE = Intent-to-Treat-Effekt / Compliance-Rate Latenter Konfunder (Motivation): In dieser Simulation entscheiden Nicht-Complier aufgrund ihrer Motivation — unmotivierte EG-Personen lehnen die Behandlung ab, hochmotivierte KG-Personen suchen sie aktiv. Da Motivation auch Y direkt beeinflusst (γ), ist T endogen: Naiver OLS überschätzt LATE.
Der Wald-Schätzer nutzt G (Zuweisung) als Instrument — G hängt nur von X ab, nicht von Motivation, daher ist der ITT unverzerrter Ausgangspunkt und LATE(Wald) ≈ b₂.

P(Non-Compliance | EG) 0.15

P(Crossover | KG) 0.10

Konfundierung γ 15

Konzepte

Was ist ein RDD?

Ein Regression-Discontinuity-Design nutzt einen scharfen Cutoff c auf einer kontinuierlichen Zuweisungsvariable X: wer ≥ c liegt, wird behandelt, wer darunter liegt, nicht. Knapp über und unter c unterscheiden sich Einheiten nur noch zufällig — wie in einem lokalen Experiment. Ein Sprung in Y genau am Cutoff ist dann der kausale Effekt der Behandlung.

Continuity-Annahme

Die zentrale Identifikationsannahme: alles außer der Behandlung verläuft am Cutoff stetig. Ohne Programm gäbe es keinen Sprung in Y bei c — alle anderen Einflussgrößen ändern sich glatt. Ist das plausibel, ist der Sprung kausal interpretierbar. (Das RDD-Pendant zur Parallel-Trends-Annahme bei DiD.) Manipulieren Einheiten ihren Score gezielt über c, ist die Annahme verletzt (McCrary-Dichtetest).

LATE — der lokale Effekt am Cutoff

Das RDD schätzt einen Local Average Treatment Effect (LATE): den Behandlungseffekt genau am Cutoff — den Sprung in Y bei c. Er gilt nur für Einheiten nahe am Cutoff; Personen weit unter c unterscheiden sich systematisch von knapp darunter, der Effekt ist daher nicht ohne Weiteres auf sie übertragbar. Hohe interne, eingeschränkte externe Validität.

Das Schätzmodell

Geschätzt wird das LATE mit Y = b₀ + b₁(X−c) + b₂·T + b₃·T(X−c). Die Zuweisungsvariable wird am Cutoff zentriert (X−c), damit b₂ = der Sprung bei c = LATE ist. b₁ ist die Steigung links, b₃ der Steigungsunterschied rechts. So bekommen beide Seiten getrennte Geraden, und man liest den vertikalen Abstand am Cutoff direkt als Effekt ab.

Bandbreite & Polynome — Fallstricke

Ein schmaleres Fenster um c reduziert Verzerrung (nur vergleichbare Einheiten), erhöht aber die Varianz (weniger Daten) — der klassische Bias-Varianz-Trade-off. Hohe Polynomgrade wirken flexibel, erzeugen aber Overfitting und Artefakte an den Rändern, die den Sprung verfälschen. Empfehlung (Gelman & Imbens 2019): lokal-lineare Schätzung in enger Bandbreite statt globaler Polynome hohen Grades.

Sharp vs. Fuzzy & Einordnung

Sharp RDD: Überschreiten des Cutoffs bestimmt die Behandlung vollständig (T = 1 ⇔ X ≥ c). Fuzzy RDD: der Cutoff erhöht nur die Behandlungswahrscheinlichkeit, erzwingt sie aber nicht — manche knapp über c machen nicht mit (No-Shows), manche knapp darunter werden trotzdem behandelt (Crossover). Die Behandlungsrate springt bei c also um weniger als 100 %. Ein naiver Vergleich der Y-Werte unterschätzt den Effekt deshalb. Der Wald-Schätzer korrigiert das: er teilt den Sprung in Y durch den Sprung in der Behandlungsrate und gewinnt so den Effekt für die Complier (jene, die sich tatsächlich vom Cutoff zur Teilnahme bewegen lassen) zurück. RDD gehört zu den quasi-experimentellen Designs ohne Randomisierung. → Difference-in-Differences · → Propensity Score Matching · → Kausale Inferenz