Laufendes Beispiel
Blutdruckstudie — Eine Hausarztpraxis misst den systolischen Blutdruck bei
400 Patienten (Erstmessung T1, μ = 130, σ = 20 mmHg). Alle Patienten mit
Blutdruck ≥ 160 mmHg werden in ein Hypertonie-Programm aufgenommen und
vier Wochen später erneut gemessen (T2) — ohne medikamentöse Intervention.
Im Durchschnitt verbessert sich die Gruppe um — mmHg.
Echte Wirkung oder statistisches Artefakt?
Grundprinzip
E[Y | X = x]
= μ +
r
· (x − μ)
(Regressionsgerade)
Regressionseffekt
= (1 −
r
) · (x − μ)
(Regression zur Mitte)
r = 0.70 ·
Schwelle = 160 mmHg ·
Erw. RTM an der Schwelle: −9.0 mmHg
Streudiagramm T1 vs. T2
Selektierte Gruppe
— Personen
X ≥ — mmHg
Mittleres T1 (selektiert)
—
Erstmessung, mmHg
Beobachtete Regression
—
T2 − T1 (mmHg)
Erwartet aus r
—
(r−1)·(T1̄−μ), mmHg
Schlussfolgerung: Die selektierte Gruppe verbessert sich im Durchschnitt um
— mmHg — ohne jede Behandlung. Dieser Regressionseffekt
ist exakt aus r vorhersagbar: — mmHg erwartet.
Ohne Kontrollgruppe würde man diesen Artefakt fälschlicherweise der Intervention zuschreiben.
Beachte auch die blaue Gruppe (niedrige T1-Werte):
sie zeigt Regression nach oben — derselbe Effekt, entgegengesetzte Richtung.
Konzepte
Was ist Regression zur Mitte?
Wer bei einer Messung extrem hoch oder niedrig abschneidet, liegt beim nächsten Mal im Durchschnitt näher am Mittelwert — auch wenn sich nichts verändert hat. Ursache: ein extremes Ergebnis enthält einen hohen Zufallsanteil, der beim nächsten Messzeitpunkt "verschwindet". Je unzuverlässiger die Messung, desto stärker der Effekt.
Galton's Entdeckung (1886)
Francis Galton beobachtete, dass Kinder sehr großer Eltern zwar größer als der Durchschnitt sind — aber im Schnitt kleiner als ihre Eltern. Kinder sehr kleiner Eltern waren kleiner als der Durchschnitt, aber größer als ihre Eltern. Er nannte es "regression toward mediocrity". Der Begriff "Regressionsgerade" ist ein direktes Erbe dieser Beobachtung.
Reliabilität r als Schlüsselfaktor
Der Regressionseffekt beträgt (1 − r) · (x − μ). Bei r = 1.0: kein Effekt. Bei r = 0.7: 30% des Abstands zum Mittelwert verschwinden. Bei r = 0.4: 60% verschwinden. Reliabilität ist der einzige steuerbare Faktor — präzisere Messung reduziert den RTM-Effekt.
Kontrollgruppe als Lösung
Die einzige Möglichkeit, echte Intervention von RTM zu trennen, ist eine randomisierte Kontrollgruppe. Beide Gruppen zeigen denselben RTM-Effekt. Der Unterschied zwischen ihnen schätzt den bereinigten Interventionseffekt. Ohne Kontrollgruppe ist ein Pre-Post-Ergebnis schlicht nicht interpretierbar.
Bidirektionalität
Hochscorer regredieren nach unten, Niedrigscorer nach oben. Der "Sophomore Slump" im Sport (der beste Spieler der Saison ist nächstes Jahr schlechter), spontane Erholung aus Extremzuständen, der Effekt von Fördermaßnahmen für Schwache — all das enthält RTM-Anteile.
Klinische Relevanz
Patienten mit sehr hohem Blutdruck, starken Schmerzen oder schlechtem Befinden befinden sich beim Studieneinschluss oft in einem temporären "Hochpunkt". Selbst ohne Behandlung verbessern sich viele — weil der nächste Messzeitpunkt zwangsläufig weniger extrem ausfällt. Pre-Post-Studien ohne Kontrollgruppe führen fast zwingend zu positiven, aber artifziellen Ergebnissen.