Effektgrößen-Werkzeug — Berechnung & Übersetzung

Dr. R. Düsing · Universität Osnabrück

Hilfe — Effektgrößen-Werkzeug

Was zeigt dieses Tool?

Das Werkzeug berechnet und übersetzt Effektgrößen für Within-t-Tests (Messwiederholung) und Between-t-Tests (unabhängige Gruppen). Es zeigt drei Standardisierungen gleichzeitig — dz, drm, dav — sowie drei kleine-Stichproben-Korrekturen und drei CI-Methoden.

Das laufende Beispiel

Eine Psychologin untersucht, ob ein 8-wöchiges Achtsamkeitstraining das Wohlbefinden steigert. Within: 40 Teilnehmende, Mprä=45.8 (SD=8.4), Mpost=52.4 (SD=9.6), r=.65. Konvention: d = Post − Prä, d > 0 = Anstieg. Between: 40 Teilnehmende je Gruppe (Training vs. Warteliste-Kontrolle).

Drei Standardisierungen (Within)

dz — Differenzen-SD als Nenner; direkt für t-Test-Power und CLES (Wuensch).
drm — dz · √(2(1−r)) (Becker 1988): gleich dav bei Varianzhomogenität, gleich dz bei r=.5.
dav — Mittlere SD als Nenner (Lakens 2013); kein r im Nenner.

d_av und Vergleichbarkeit mit Between-Designs

dav ist am ehesten mit Between-Designs vergleichbar. Da die Prä-Post-Korrelation nicht in den Nenner eingeht, ist dav — ceteris paribus — identisch mit Cohen's d aus einem unabhängigen Gruppenvergleich. Das ermöglicht eine direkte Replikation über Designs hinweg: Ein Within-dav von 0.5 bedeutet dasselbe wie ein Between-ds von 0.5. dz und drm hingegen hängen von r ab und sind designspezifisch.

Korrekturen für kleine Stichproben

j (Hedges) — 1 − 3/(4(n−1)−1); am gebräuchlichsten.
nag (Nakagawa) — 1 − 3/(4(2n−2)−1); empfohlen für Within-Designs.
Bon (Bonett) — √((n−2)/(n−1)); basiert auf Varianz-Unbiasedness.

Konfidenzintervalle

Bonett (2015) approx: z-basiert (Formeln 8, 9, 16). Verfügbar für dz, drm, dav.
Rosenthal (1994) approx: t-basiert, nur für drm — dort identische SE wie Bonett, aber crit_t statt crit_z. Für dz und dav ist kein Rosenthal-CI in der Originalliteratur definiert.
NCT (Momenten-Approx.): Nichtzentrale t-Verteilung via Momenten-Anpassung und CDF-Inversion. Sehr akkurat für n ≥ 10; kein Simulationsaufwand.

CSV-Upload

Laden Sie eine CSV-Datei mit zwei numerischen Spalten hoch. Im Within-Modus: Spalte 1 = Messung 1, Spalte 2 = Messung 2. Im Between-Modus: Spalte 1 = Gruppe 1, Spalte 2 = Gruppe 2 (verschiedene Längen erlaubt). Erste Zeile wird als Header erkannt, wenn sie nicht-numerisch ist.

Laufendes Beispiel: Eine Psychologin untersucht, ob ein 8-wöchiges Achtsamkeitstraining das Wohlbefinden steigert. Within-Design: 40 Teilnehmende, Mprä=45.8 (SD=8.4), Mpost=52.4 (SD=9.6), r=.65. Konvention: d = Post − Prä, positiver Wert = Anstieg. Wie groß ist der Effekt — und hängt die Antwort von der gewählten Standardisierung ab?
Kennwerte eingeben oder CSV laden — Ergebnisse erscheinen hier.
Konzepte
Warum drei Standardisierungen?
Im Within-Design gibt es keinen einzigen "richtigen" Nenner. dz nutzt die Variabilität der Differenzen — kleiner bei hoher r, gut für Power-Rechnungen. dav ignoriert r im Nenner — daher direkt mit Between-d vergleichbar (ceteris paribus identisch). drm (Becker 1988) = dz·√(2(1−r)): gleich dav bei gleichen SDs, gleich dz bei r=.5.
Kleine Stichproben: Korrekturen
Cohens d ist ein nach oben verzerrter Schätzer von δ. Die Hedges-j-Korrektur ist am gebräuchlichsten. Nakagawa/Cuthill (2007) empfehlen eine angepasste Formel für Messwiederholungen. Bonett (2015) basiert auf Varianz-Unbiasedness und ist konservativ.
NCT-Konfidenzintervalle
Cohen's d ist ein Nicht-zentralitäts-Parameter λ = δ·√n. Exakte CIs invertieren die CDF der nichtzentranen t-Verteilung: finde λL und λU sodass P(T ≤ t_obs | λ) = 1−α/2 und α/2. Keine Simulation nötig — die ibeta-Funktion berechnet die CDF analytisch.
Effektgrößen übersetzen
Zwischen Konventionen gilt: r = d/√(d²+4), η² ≈ r², OR = exp(d·π/√3). Cohens U₃ = Φ(d) zeigt den Anteil der Kontrollgruppe, den der Treatment-Mittelwert übersteigt. CLES = Φ(d/√2) ist die Wahrscheinlichkeit, dass Person aus Gr.1 > Person aus Gr.2.
Grenzen
Standardisierte Effektgrößen sind nur vergleichbar, wenn die Populationsstreuungen ähnlich sind. Bei hochselektiven Stichproben (Range Restriction) unterschätzt d den wahren Effekt. Reliability-Attenuation zieht d weiter nach unten — Disattenuation kann notwendig sein.
CSV-Tipp
Spalten-Header werden automatisch erkannt (erste Zeile nicht-numerisch). Fehlende Werte (NA, "", leer) werden fallweise ausgeschlossen. Im Between-Modus dürfen die Spalten verschieden lang sein — n₁ und n₂ werden separat berechnet. Dezimalkomma (,) wird automatisch in Dezimalpunkt (.) konvertiert.