Regression zur Mitte

Laufendes Beispiel

Blutdruckstudie — Eine Hausarztpraxis misst den systolischen Blutdruck bei 400 Patienten (Erstmessung T1, μ = 130, σ = 20 mmHg). Alle Patienten mit Blutdruck ≥ 160 mmHg werden in ein Hypertonie-Programm aufgenommen und vier Wochen später erneut gemessen (T2) — ohne medikamentöse Intervention. Im Durchschnitt verbessert sich die Gruppe um — mmHg. Echte Wirkung oder statistisches Artefakt?

Grundprinzip

E[Y | X = x] = μ + r · (x − μ) (Regressionsgerade)

Regressionseffekt = (1 − r ) · (x − μ) (Regression zur Mitte)

      r = 0.70  · 
      Schwelle = 160 mmHg  · 
      Erw. RTM an der Schwelle: −9.0 mmHg
    

Streudiagramm T1 vs. T2

Selektierte Gruppe

— Personen

X ≥ — mmHg

Mittleres T1 (selektiert)

—

Erstmessung, mmHg

Beobachtete Regression

—

T2 − T1 (mmHg)

Erwartet aus r

—

(r−1)·(T1̄−μ), mmHg

Schlussfolgerung: Die selektierte Gruppe verbessert sich im Durchschnitt um — mmHg — ohne jede Behandlung. Dieser Regressionseffekt ist exakt aus r vorhersagbar: — mmHg erwartet. Ohne Kontrollgruppe würde man diesen Artefakt fälschlicherweise der Intervention zuschreiben. Beachte auch die blaue Gruppe (niedrige T1-Werte): sie zeigt Regression nach oben — derselbe Effekt, entgegengesetzte Richtung.

Konzepte

Was ist Regression zur Mitte?

Wer bei einer Messung extrem hoch oder niedrig abschneidet, liegt beim nächsten Mal im Durchschnitt näher am Mittelwert — auch wenn sich nichts verändert hat. Ursache: ein extremes Ergebnis enthält einen hohen Zufallsanteil, der beim nächsten Messzeitpunkt "verschwindet". Je unzuverlässiger die Messung, desto stärker der Effekt.

Galton's Entdeckung (1886)

Francis Galton beobachtete, dass Kinder sehr großer Eltern zwar größer als der Durchschnitt sind — aber im Schnitt kleiner als ihre Eltern. Kinder sehr kleiner Eltern waren kleiner als der Durchschnitt, aber größer als ihre Eltern. Er nannte es "regression toward mediocrity". Der Begriff "Regressionsgerade" ist ein direktes Erbe dieser Beobachtung.

Reliabilität r als Schlüsselfaktor

Der Regressionseffekt beträgt (1 − r) · (x − μ). Bei r = 1.0: kein Effekt. Bei r = 0.7: 30% des Abstands zum Mittelwert verschwinden. Bei r = 0.4: 60% verschwinden. Reliabilität ist der einzige steuerbare Faktor — präzisere Messung reduziert den RTM-Effekt.

Kontrollgruppe als Lösung

Die einzige Möglichkeit, echte Intervention von RTM zu trennen, ist eine randomisierte Kontrollgruppe. Beide Gruppen zeigen denselben RTM-Effekt. Der Unterschied zwischen ihnen schätzt den bereinigten Interventionseffekt. Ohne Kontrollgruppe ist ein Pre-Post-Ergebnis schlicht nicht interpretierbar.

Bidirektionalität

Hochscorer regredieren nach unten, Niedrigscorer nach oben. Der "Sophomore Slump" im Sport (der beste Spieler der Saison ist nächstes Jahr schlechter), spontane Erholung aus Extremzuständen, der Effekt von Fördermaßnahmen für Schwache — all das enthält RTM-Anteile.

Klinische Relevanz

Patienten mit sehr hohem Blutdruck, starken Schmerzen oder schlechtem Befinden befinden sich beim Studieneinschluss oft in einem temporären "Hochpunkt". Selbst ohne Behandlung verbessern sich viele — weil der nächste Messzeitpunkt zwangsläufig weniger extrem ausfällt. Pre-Post-Studien ohne Kontrollgruppe führen fast zwingend zu positiven, aber artifziellen Ergebnissen.

Regression zur Mitte

Hilfe — Regression zur Mitte