Partial- & Semipartialkorrelation

Beispiel

X₁Wöchentliche Lernzeit (Stunden/Woche) — Prädiktor von Interesse X₂Intelligenz (IQ-Score, standardisiert) — Kontrollvariable YKlausurleistung (Punkte, 0–100)

Wie stark korreliert Lernzeit mit Klausurleistung, wenn man Intelligenzunterschiede herausrechnet? Geht der Effekt auf eigenständige Lernbereitschaft zurück — oder ist er nur ein Artefakt, weil Klügere zufällig auch mehr lernen? (Szenario D — Reziproke Suppression — wechselt zu einem anderen Beispiel: Dominanz & Empathie als Prädiktoren von Führungserfolg.)

Konzept

r_Y·X₁ = bivariat (Pearson)
r_semi = Semipartial: e(X₁|X₂) ~ Y → X₂ nur aus X₁ herauspartialisiert
r_partial = Partial: e(X₁|X₂) ~ e(Y|X₂) → X₂ aus X₁ und Y herauspartialisiert
r_semi² = ΔR² (einzigartiger Varianzanteil X₁) · r_partial² = Anteil erklärter Restvarianz

Streudiagramme — schrittweise residualisiert

1 · X₁ vs Y ρ=— r̂=—

2 · e(X₁|X₂) vs Y semi=—

3 · e(X₁|X₂) vs e(Y|X₂) part=—

Ballantine-Diagramm — Varianzzerlegung

Statistiken — Population vs. Stichprobe

Statistik	Population	Stichprobe	t	p	Anmerkung

Multiple Regression — X₁ + X₂ → Y

Konzepte

Bivariat, Semi- & Partialkorrelation

Drei Stufen der Kontrolle: Die bivariate r misst den Zusammenhang von X₁ und Y ohne jede Kontrolle. Die Semipartialkorrelation entfernt X₂'s Einfluss nur aus X₁ — Y bleibt roh. Sie ist die Quadratwurzel von ΔR² und misst den einzigartigen Beitrag von X₁ zur Y-Varianz. Die Partialkorrelation entfernt X₂ aus beiden: Sie misst die Stärke des X₁-Y-Zusammenhangs innerhalb der Ebene, die X₂ nicht erklärt.

Residualisierung — was passiert geometrisch?

„Herauspartialisieren" bedeutet: Vorhersage durch X₂ entfernen. Man regressiert X₁ auf X₂ und nimmt die Residuen e(X₁|X₂) — den Teil von X₁, den X₂ nicht erklärt. Im Streudiagramm-Triptychon sieht man, wie die Punktwolke auf X-Achse „bereinigt" wird (Plot 2), und in Plot 3 auch auf Y-Achse. Die Punktfärbung nach X₂ zeigt: nach Residualisierung gibt es keine X₂-Muster mehr in der X-Achsen-Streuung.

Das Ballantine-Diagramm

Drei überlappende Kreise (X₁, X₂, Y) visualisieren die R²-Zerlegung. Die blaue Zone b = ΔR²(X₁) = Semipartial² — einzigartiger X₁-Anteil. Die grüne Zone d = ΔR²(X₂). Die lila Zone c = geteilte Varianz, die beiden Prädiktoren zugleich zugeordnet werden könnte. c kann negativ werden (Suppression) — dann bricht das Venn-Diagramm geometrisch zusammen, die Werte bleiben aber gültig. Grauer Bereich a = unerklärte Y-Varianz (1−R²).

Suppression — drei Varianten

Bei allen drei Varianten gilt β₁_multipel > β₁_einfach (und c < 0 im Ballantine). Fall 1 — Klassisch (McNemar 1945): ρ(X₂,Y) ≈ 0, ρ(X₁,X₂) > 0 → Szenario C. X₂ enthält Störvarianz in X₁, die Y-irrelevant ist. Fall 2 — Negativ/Net: alle Korrelationen positiv, aber ρ(X₂,Y) < ρ(X₁,X₂)·ρ(X₁,Y). Gradueller Übergang zu Fall 1. Fall 3 — Reziproke Suppression/Komplementarität (Conger 1974): X₁ und X₂ beide positiv mit Y, aber negativ untereinander → Szenario D. Beide Prädiktoren supprimieren sich gegenseitig (Velicer, 1978; Darlington & Hayes, 2017).

Reziproke Suppression / Komplementarität

Kennzeichen: ρ(X₁,Y) > 0, ρ(X₂,Y) > 0, aber ρ(X₁,X₂) < 0. Beide Prädiktoren korrelieren positiv mit Y, sind aber untereinander negativ korreliert — jeder enthält Störvarianz des anderen. Folge: β₁_multipel > β₁_einfach und β₂_multipel > β₂_einfach. Beispiel (Szenario D): Dominanz (X₁, r=.30) und Empathie (X₂, r=.25) korrelieren beide positiv mit Führungserfolg, aber negativ miteinander (r=−.30). Kontrolliert man jeweils die andere Variable, steigen beide β-Gewichte — das gegenseitige Unterdrücken wird aufgehoben.

Kollinearität & ΔR²

Hohe Kollinearität (ρ(X₁,X₂) groß) führt zu kleinen ΔR²-Werten für beide Prädiktoren, auch wenn beide bivariat stark mit Y korrelieren. Die Prädiktoren „konkurrieren" um denselben Y-Varianzanteil. In der multiplen Regression: große SE, instabile β-Koeffizienten, VIF → 1/(1−R²_j) steigt. Szenario B zeigt: bivariat r=0.6, aber ΔR²(X₁)≈0.04. Semipartialkorrelation quadriert gibt den einzigartigen Beitrag direkt — das ist die ehrlichste Effektgröße in der multiplen Regression.