Eine Längsschnittstudie erhebt Soziale Unterstützung Z und Stresslevel X (beide z-standardisiert, t=1, vollständig beobachtet; r(X,Z)=−.40) sowie Wohlbefinden Y (0–100, t=2, teilweise fehlend). Wahres DGP: Y = 60 − 6·X + 3·Z + ε. Zielanalyse: Y ~ X (einfache Regression). Z ist Auxiliary-Variable: beobachtet, im Imputationsmodell, aber nicht im Analysemodell. Der marginale Populationseffekt bei Y~X ist β_X = −7.20 (= −6 + 3·(−.40), wegen r_XZ·β_Z).
MCAR — Missing Completely At Random
P(Y fehlt) ist konstant und unabhängig von X, Z und Y — z. B. technischer Serverausfall. Listwise in Y~X liefert unverzerrte Schätzer, verliert aber Effizienz. MI (Imputation mit X+Z, Analyse Y~X) ist ebenfalls unverzerrt und effizienter.
MAR — Missing At Random
P(Y fehlt | X, Z): hoher Stress (X↑) UND niedrige Soziale Unterstützung (Z↓) erhöhen die Dropout-Wahrscheinlichkeit gemeinsam. Beide sind beobachtet — das Fehlmuster ist durch beobachtete Variablen vollständig erklärbar.
Listwise in der Zielanalyse Y ~ X ist doppelt verzerrt: (1) hohe-X-Personen fehlen → β_X unterschätzt (|Effekt| zu klein); (2) niedrige-Z-Personen fehlen → μ_Y überschätzt. MI korrigiert MAR, weil Z als Auxiliary-Prädiktor im Imputationsmodell enthalten ist — obwohl Z nicht in der Zielanalyse Y~X vorkommt. Der Schlüsselpunkt: das Imputationsmodell muss reicher sein als das Analysemodell.
MNAR — Missing Not At Random
P(Y fehlt | Y) hängt vom fehlenden Y selbst ab — z. B. Personen mit niedrigem Wohlbefinden brechen gerade wegen ihres niedrigen Wohlbefindens ab. Das Fehlmuster ist durch keine beobachtete Variable vollständig erklärbar. Listwise ist stark verzerrt. MI ist theoretisch nicht gültig, reduziert den Bias in der Praxis aber oft erheblich — und ist in Simulationsstudien selten schlechter als Alternativen.
Listwise-Deletion — Wann sie versagt
Listwise (Complete Case Analysis) schließt alle Beobachtungen mit fehlendem Y aus und rechnet nur mit den Vollständigen. Nur bei MCAR unverzerrt. Bei MAR und MNAR ist die verbleibende Stichprobe keine Zufallsstichprobe mehr — Mittelwert und Regressionskoeffizienten können systematisch verzerrt sein.
Mean Imputation — Warum sie scheitert
Mean Imputation ersetzt alle fehlenden Y durch den beobachteten Mittelwert ȳ_obs. Das stellt zwar den Mittelwert grob wieder her (unter MCAR), verzerrt aber die Varianz und alle Korrelationen erheblich — weil künstlich viele Beobachtungen genau auf dem Mittelwert liegen. Der Slope β_X wird bei MAR und MNAR stark unterschätzt (Attenuation).
Multiple Imputation — PMM Algorithmus
Hier wird Predictive Mean Matching (PMM, Default in R's mice-Paket) verwendet. PMM imputiert immer echte beobachtete Werte — keine Werte außerhalb der Datenrange, robuster gegen Nicht-Normalität:
Für m = 1 … M:
1. Passe Imputationsmodell OLS: Ŷ = α̂ + β̂_X·X + β̂_Z·Z (auf Beobachtete)
2. Perturbiere Parameter: α̃,β̃_X,β̃_Z ~ N(Schätzung, SE)
3. Berechne ŷ_i (fehlend) und ŷ_j (beobachtet) mit pert. Parametern
4. Finde k=5 nächste Spender j: |ŷ_i − ŷ_j| minimal
5. Ziehe einen Spender j* zufällig; imputiere y_i = y_j*
6. Analysiere vervollständigten Datensatz mit Y~X → θ̂_m (β_X, μ_Y)
Pooling nach Rubin (1987):
θ̂_MI = (1/M) Σ θ̂_m
Var_MI = W + (1 + 1/M)·B
W = (1/M) Σ Var_m (Within-Varianz)
B = Σ(θ̂_m − θ̂_MI)²/(M−1) (Between-Varianz)
B misst die Zusatz-Unsicherheit durch die Imputation. Je mehr fehlende Werte und je schwächer das Imputationsmodell, desto größer B. Mit "◇ MI anzeigen" lassen sich die imputierten Y-Werte als hohle Diamanten (◇) im Plot einblenden — sie streuen um die Regressionsgerade des Imputationsmodells.
Wann MI gut funktioniert
1. Gutes Imputationsmodell: Alle Variablen, die das Fehlmuster und das Outcome vorhersagen, müssen im Imputationsmodell enthalten sein — auch wenn sie nicht im Analysemodell stehen. Hier: X (Hauptprädiktor, auch in Y~X) und Z (Auxiliary — erzeugt MAR-Muster, beeinflusst Y, aber nicht im Analysemodell Y~X). 2. MAR plausibel: Das Fehlmuster sollte durch beobachtete Variablen gut erklärt sein. 3. m ≥ 5–20: Mehr Imputationen → stabilere Schätzer, kleinerer Between-Varianz-Anteil. 4. Nicht zu viel Missing: Ab >50% wird MI instabil, weil das Imputationsmodell auf zu wenig Daten basiert. 5. MNAR: MI ist keine perfekte Lösung, aber praktisch selten schlechter als Listwise oder Mean Imputation.
Fehlmechanismus
Parameter
n · Stichprobengröße150
% fehlend (Y)30%
m · Imputationen10
β_X · Stärke X→Y−6.0
MCAR: Rein zufällige Fehlmuster — lila Kreise (○) gleichmäßig über alle Y-Werte verteilt.
Durchgehendes Beispiel
ZAuxiliary-Variable — vollständig beobachtet, beeinflusst Y (β_Z = +3) und (unter MAR) die Missingness. Nicht Teil der Forschungsfrage, aber nötig im Imputationsmodell.XHauptprädiktor — vollständig beobachtet, r(X,Z) = −.40YOutcome — Wohlbefinden t=2 (0–100), teilweise fehlendWahrer DGPY = 60 − 6.0·X + 3·Z + ε — Z beeinflusst Y in der Realität, auch wenn der Forscher nur Y ~ X modelliert. Ohne Z→Y könnte PMM keine besseren Spender finden und MI hätte keinen Vorteil.ZielanalyseY ~ X — marginaler Populationseffekt β_X = −7.20 (= −6.0 + 3·(−0.40), weil Z→Y und r_XZ = −.40)MAR-BiasZ↓ und X↑ → Dropout. Fehlende haben niedrigeres Y. Listwise: (1) μ_Y↑ und (2) β_X zu flach. MI-Fix: Z im Imputationsmodell → PMM findet Spender mit korrekt niedrigen Y-Werten.
Warum Z ins Imputationsmodell, wenn die Analyse nur Y ~ X ist? — Z sagt sowohl die Missingness als auch Y voraus. Ohne Z würde PMM die fehlenden Y-Werte systematisch zu hoch schätzen. Das Imputationsmodell muss reicher sein als das Analysemodell (Rubin 1987).
Scatter — Stresslevel X vs. Wohlbefinden Y
MCAR: Lila Kreise (○) zeigen die wahren Y-Werte fehlender Beobachtungen — gleichmäßig verteilt, kein systematisches Muster. Listwise und MI unverzerrt.
Dichteverteilung Y — Vergleich der Datensätze
Konzepte
Die drei Mechanismen
MCAR (Missing Completely At Random): das Fehlen ist völlig zufällig, hängt von nichts ab. MAR (Missing At Random): das Fehlen hängt von beobachteten Variablen ab (hier X und Z), aber nicht vom fehlenden Wert selbst. MNAR (Missing Not At Random): das Fehlen hängt vom fehlenden Wert Y selbst ab. Welcher Mechanismus vorliegt, entscheidet, welche Methode unverzerrt ist — und ist aus den Daten allein nicht sicher prüfbar.
Listwise Deletion (Complete Case)
Streicht alle Fälle mit fehlendem Y und rechnet nur mit den Vollständigen. Nur bei MCAR unverzerrt. Bei MAR/MNAR ist die Reststichprobe keine Zufallsstichprobe mehr → Mittelwert und Regressionskoeffizient können systematisch verzerrt sein. Selbst bei MCAR kostet sie immer Effizienz (kleineres n, größere Standardfehler).
Mean Imputation — warum sie scheitert
Ersetzt jedes fehlende Y durch den beobachteten Mittelwert. Das stellt (unter MCAR) grob den Mittelwert wieder her, zerstört aber Varianz und Korrelationen: künstlich liegen viele Punkte exakt auf dem Mittel, die Streuung wird zu klein und der Slope βX zu flach (Attenuation). Eine scheinbare Lösung, die neue Verzerrung schafft.
Multiple Imputation (PMM)
Statt eines Ersatzwerts erzeugt MI mehrere vollständige Datensätze. Predictive Mean Matching zieht für jede Lücke einen plausiblen echten Spenderwert aus ähnlichen Fällen. Man analysiert jeden Datensatz und poolt die Ergebnisse (Rubin's Rules) — so fließt die Imputationsunsicherheit in die Standardfehler ein, anders als bei Single Imputation.
Das Imputationsmodell muss reicher sein
Der Schlüssel zu MAR: alle Variablen, die das Fehlmuster oder Y vorhersagen, gehören ins Imputationsmodell — auch eine Auxiliary-Variable Z, die gar nicht in der Zielanalyse Y~X vorkommt. Hier erzeugt Z das MAR-Muster und beeinflusst Y; nimmt man Z ins Imputationsmodell, findet PMM Spender mit korrekt niedrigen Y-Werten und der MAR-Bias verschwindet. Imputationsmodell ⊇ Analysemodell.
Welche Methode wann?
MCAR: alles unverzerrt, Listwise nur ineffizient. MAR: Multiple Imputation (oder FIML/ML) korrigiert — vorausgesetzt, die relevanten Prädiktoren sind im Modell. MNAR: keine Methode korrigiert vollständig; man braucht Annahmen über den Mechanismus und Sensitivitätsanalysen. Verwandt ist die allgemeine Logik von Selektionseffekten: wer in den Daten landet, hängt vom Mechanismus ab. → Berkson's Paradox (Selektion)