Das Werkzeug berechnet und übersetzt Effektgrößen für Within-t-Tests (Messwiederholung) und Between-t-Tests (unabhängige Gruppen). Es zeigt drei Standardisierungen gleichzeitig — dz, drm, dav — sowie drei kleine-Stichproben-Korrekturen und drei CI-Methoden.
Das laufende Beispiel
Eine Psychologin untersucht, ob ein 8-wöchiges Achtsamkeitstraining das Wohlbefinden steigert. Within: 40 Teilnehmende, Mprä=45.8 (SD=8.4), Mpost=52.4 (SD=9.6), r=.65. Konvention: d = Post − Prä, d > 0 = Anstieg. Between: 40 Teilnehmende je Gruppe (Training vs. Warteliste-Kontrolle).
Drei Standardisierungen (Within)
dz — Differenzen-SD als Nenner; direkt für t-Test-Power und CLES (Wuensch). drm — dz · √(2(1−r)) (Becker 1988): gleich dav bei Varianzhomogenität, gleich dz bei r=.5. dav — Mittlere SD als Nenner (Lakens 2013); kein r im Nenner.
d_av und Vergleichbarkeit mit Between-Designs
dav ist am ehesten mit Between-Designs vergleichbar. Da die Prä-Post-Korrelation nicht in den Nenner eingeht, ist dav — ceteris paribus — identisch mit Cohen's d aus einem unabhängigen Gruppenvergleich. Das ermöglicht eine direkte Replikation über Designs hinweg: Ein Within-dav von 0.5 bedeutet dasselbe wie ein Between-ds von 0.5. dz und drm hingegen hängen von r ab und sind designspezifisch.
Korrekturen für kleine Stichproben
j (Hedges) — 1 − 3/(4(n−1)−1); am gebräuchlichsten. nag (Nakagawa) — 1 − 3/(4(2n−2)−1); empfohlen für Within-Designs. Bon (Bonett) — √((n−2)/(n−1)); basiert auf Varianz-Unbiasedness.
Konfidenzintervalle
Bonett (2015) approx: z-basiert (Formeln 8, 9, 16). Verfügbar für dz, drm, dav. Rosenthal (1994) approx: t-basiert, nur für drm — dort identische SE wie Bonett, aber crit_t statt crit_z. Für dz und dav ist kein Rosenthal-CI in der Originalliteratur definiert. NCT (Momenten-Approx.): Nichtzentrale t-Verteilung via Momenten-Anpassung und CDF-Inversion. Sehr akkurat für n ≥ 10; kein Simulationsaufwand.
CSV-Upload
Laden Sie eine CSV-Datei mit zwei numerischen Spalten hoch. Im Within-Modus: Spalte 1 = Messung 1, Spalte 2 = Messung 2. Im Between-Modus: Spalte 1 = Gruppe 1, Spalte 2 = Gruppe 2 (verschiedene Längen erlaubt). Erste Zeile wird als Header erkannt, wenn sie nicht-numerisch ist.
Design
Eingabe
CSV hier ablegen oder klicken
Keine Datei geladen
α =
Kernbefunde
t = —
p = —
dz = —
drm = —
dav = —
Laufendes Beispiel: Eine Psychologin untersucht, ob ein 8-wöchiges Achtsamkeitstraining das Wohlbefinden steigert. Within-Design: 40 Teilnehmende, Mprä=45.8 (SD=8.4), Mpost=52.4 (SD=9.6), r=.65. Konvention: d = Post − Prä, positiver Wert = Anstieg. Wie groß ist der Effekt — und hängt die Antwort von der gewählten Standardisierung ab?
Kennwerte eingeben oder CSV laden — Ergebnisse erscheinen hier.
Within-t-Test
—
df = —
p-Wert
—
—
M₁ (Prä)
—
SD = —
M₂ (Post)
—
SD = —
M_dif (Post − Prä)
—
Rohwertsdifferenz
95%-KI (Rohwert)
—
KI für Mittelwertsdiff.
Effektgröße: Standardisierungen im Vergleich
dz — Differenzen-SD als Nenner (Direktwert für Within-Power)
drm — Korrigiert für Messwiederholung (Becker 1988)
dav — Mittlere SD als Nenner (Lakens 2013)
Weitere Maße
Effektgröße: Between-Gruppen-Vergleich
Cohen's d — Verschiedene Definitionen
Visualisierung: Überlappung
Nichtzentrale t-Verteilung & CI
Effektgrößen-Übersetzer (aus dav / ds)
Konzepte
Warum drei Standardisierungen?
Im Within-Design gibt es keinen einzigen "richtigen" Nenner. dz nutzt die Variabilität der Differenzen — kleiner bei hoher r, gut für Power-Rechnungen. dav ignoriert r im Nenner — daher direkt mit Between-d vergleichbar (ceteris paribus identisch). drm (Becker 1988) = dz·√(2(1−r)): gleich dav bei gleichen SDs, gleich dz bei r=.5.
Kleine Stichproben: Korrekturen
Cohens d ist ein nach oben verzerrter Schätzer von δ. Die Hedges-j-Korrektur ist am gebräuchlichsten. Nakagawa/Cuthill (2007) empfehlen eine angepasste Formel für Messwiederholungen. Bonett (2015) basiert auf Varianz-Unbiasedness und ist konservativ.
NCT-Konfidenzintervalle
Cohen's d ist ein Nicht-zentralitäts-Parameter λ = δ·√n. Exakte CIs invertieren die CDF der nichtzentranen t-Verteilung: finde λL und λU sodass P(T ≤ t_obs | λ) = 1−α/2 und α/2. Keine Simulation nötig — die ibeta-Funktion berechnet die CDF analytisch.
Effektgrößen übersetzen
Zwischen Konventionen gilt: r = d/√(d²+4), η² ≈ r², OR = exp(d·π/√3). Cohens U₃ = Φ(d) zeigt den Anteil der Kontrollgruppe, den der Treatment-Mittelwert übersteigt. CLES = Φ(d/√2) ist die Wahrscheinlichkeit, dass Person aus Gr.1 > Person aus Gr.2.
Grenzen
Standardisierte Effektgrößen sind nur vergleichbar, wenn die Populationsstreuungen ähnlich sind. Bei hochselektiven Stichproben (Range Restriction) unterschätzt d den wahren Effekt. Reliability-Attenuation zieht d weiter nach unten — Disattenuation kann notwendig sein.
CSV-Tipp
Spalten-Header werden automatisch erkannt (erste Zeile nicht-numerisch). Fehlende Werte (NA, "", leer) werden fallweise ausgeschlossen. Im Between-Modus dürfen die Spalten verschieden lang sein — n₁ und n₂ werden separat berechnet. Dezimalkomma (,) wird automatisch in Dezimalpunkt (.) konvertiert.