Regression zur Mitte

Dr. R. Düsing · Universität Osnabrück

Hilfe — Regression zur Mitte

Was zeigt dieses Tool?

Personen, die bei einer ersten Messung extrem hohe oder extrem niedrige Werte erzielen, liegen beim zweiten Messen im Durchschnitt näher am Mittelwert — auch ohne jede Intervention. Das Tool simuliert diesen Effekt anhand einer fiktiven Blutdruckstudie.

Das laufende Beispiel

Eine Hausarztpraxis misst den systolischen Blutdruck bei n Patienten (Erstmessung T1). Alle mit Blutdruck ≥ Schwellenwert werden in ein Hypertonie-Programm aufgenommen und vier Wochen später erneut gemessen (T2) — ohne medikamentöse Intervention. Die Frage: Woher kommt die Verbesserung?

Die Mathematik

Bei bivariat normalverteilten Messzeitpunkten X (T1) und Y (T2) mit Korrelation r gilt:

E[Y | X = x] = μ + r · (x − μ)

Der Regressionseffekt beträgt (1 − r) · (x − μ) — proportional zur Extremheit und zu (1−r). Bei r = 1 (perfekte Messung) gibt es keinen Effekt. Je größer die Messunsicherheit, desto stärker die Regression zur Mitte.

Warum ist das wichtig?

Regression zur Mitte kann eine echte Behandlungswirkung vortäuschen. In Pre-Post-Studien ohne Kontrollgruppe ist unklar, ob Verbesserungen auf die Intervention zurückgehen oder auf diesen statistischen Artefakt. Randomisierte Kontrollgruppen sind das einzige Mittel dagegen — sie zeigen denselben RTM-Effekt, sodass der Unterschied die bereinigte Intervention schätzt.

Bedienung

Szenarien A–D: vordefinierte Beispiele zum Vergleich. r: Reliabilität / Korrelation zwischen T1 und T2 — der zentrale Parameter. Schwellenwert: ab welchem Wert Personen selektiert werden. Rote Punkte: Hochselektierte (≥ Schwelle), blaue Punkte: Niedrigselektierte (spiegelbildlich). Orange Linie: E[Y|X] — die theoretische Regressionsgerade. Gestrichelt: Y = X (keine Veränderung).

Laufendes Beispiel
Blutdruckstudie — Eine Hausarztpraxis misst den systolischen Blutdruck bei 400 Patienten (Erstmessung T1, μ = 130, σ = 20 mmHg). Alle Patienten mit Blutdruck ≥ 160 mmHg werden in ein Hypertonie-Programm aufgenommen und vier Wochen später erneut gemessen (T2) — ohne medikamentöse Intervention. Im Durchschnitt verbessert sich die Gruppe um mmHg. Echte Wirkung oder statistisches Artefakt?
Grundprinzip
E[Y | X = x] = μ + r · (x − μ) (Regressionsgerade)
Regressionseffekt = (1 − r ) · (x − μ) (Regression zur Mitte)
r = 0.70  ·  Schwelle = 160 mmHg  ·  Erw. RTM an der Schwelle: −9.0 mmHg
Streudiagramm T1 vs. T2
Selektierte Gruppe
Personen
X ≥ mmHg
Mittleres T1 (selektiert)
Erstmessung, mmHg
Beobachtete Regression
T2 − T1 (mmHg)
Erwartet aus r
(r−1)·(T1̄−μ), mmHg
Schlussfolgerung: Die selektierte Gruppe verbessert sich im Durchschnitt um mmHg — ohne jede Behandlung. Dieser Regressionseffekt ist exakt aus r vorhersagbar: mmHg erwartet. Ohne Kontrollgruppe würde man diesen Artefakt fälschlicherweise der Intervention zuschreiben. Beachte auch die blaue Gruppe (niedrige T1-Werte): sie zeigt Regression nach oben — derselbe Effekt, entgegengesetzte Richtung.
Konzepte
Was ist Regression zur Mitte?
Wer bei einer Messung extrem hoch oder niedrig abschneidet, liegt beim nächsten Mal im Durchschnitt näher am Mittelwert — auch wenn sich nichts verändert hat. Ursache: ein extremes Ergebnis enthält einen hohen Zufallsanteil, der beim nächsten Messzeitpunkt "verschwindet". Je unzuverlässiger die Messung, desto stärker der Effekt.
Galton's Entdeckung (1886)
Francis Galton beobachtete, dass Kinder sehr großer Eltern zwar größer als der Durchschnitt sind — aber im Schnitt kleiner als ihre Eltern. Kinder sehr kleiner Eltern waren kleiner als der Durchschnitt, aber größer als ihre Eltern. Er nannte es "regression toward mediocrity". Der Begriff "Regressionsgerade" ist ein direktes Erbe dieser Beobachtung.
Reliabilität r als Schlüsselfaktor
Der Regressionseffekt beträgt (1 − r) · (x − μ). Bei r = 1.0: kein Effekt. Bei r = 0.7: 30% des Abstands zum Mittelwert verschwinden. Bei r = 0.4: 60% verschwinden. Reliabilität ist der einzige steuerbare Faktor — präzisere Messung reduziert den RTM-Effekt.
Kontrollgruppe als Lösung
Die einzige Möglichkeit, echte Intervention von RTM zu trennen, ist eine randomisierte Kontrollgruppe. Beide Gruppen zeigen denselben RTM-Effekt. Der Unterschied zwischen ihnen schätzt den bereinigten Interventionseffekt. Ohne Kontrollgruppe ist ein Pre-Post-Ergebnis schlicht nicht interpretierbar.
Bidirektionalität
Hochscorer regredieren nach unten, Niedrigscorer nach oben. Der "Sophomore Slump" im Sport (der beste Spieler der Saison ist nächstes Jahr schlechter), spontane Erholung aus Extremzuständen, der Effekt von Fördermaßnahmen für Schwache — all das enthält RTM-Anteile.
Klinische Relevanz
Patienten mit sehr hohem Blutdruck, starken Schmerzen oder schlechtem Befinden befinden sich beim Studieneinschluss oft in einem temporären "Hochpunkt". Selbst ohne Behandlung verbessern sich viele — weil der nächste Messzeitpunkt zwangsläufig weniger extrem ausfällt. Pre-Post-Studien ohne Kontrollgruppe führen fast zwingend zu positiven, aber artifziellen Ergebnissen.