Diagnostische Intervalle — Einzelfalldiagnostik

Durchgehendes Beispiel

PersonKind mit IQ-Testung (Wechsler-Skala, μ=100, σ=15) XBeobachteter Testwert = 115 (einmalige Messung, 1 SD über μ) r_xxReliabilität des Subtests = 0.85 SEMStandardmessfehler = σ·√(1−r_xx) = 15·√0.15 ≈ 5.81

In welchem Bereich liegt der wahre IQ dieses Kindes mit 95% Wahrscheinlichkeit — und warum liefern die drei Methoden unterschiedliche Intervalle, obwohl alle denselben Testwert nutzen?

Verteilungen & Intervalle

Populationsverteilung Prior (Vorwissen) Likelihood Posterior / CrI

Ergebnistabelle

Methode	Punktschätzer	Untere Grenze	Obere Grenze	Breite
95%-Intervalle
KI Äquivalenzhypothese	—	—	—	—
KI Regressionshypothese	—	—	—	—
Bayesianisches CrI	—	—	—	—

Interpretationsmodell: Intervall:

Konzepte

Warum ein Intervall statt eines Punktwerts?

Jede Messung enthält Messfehler — der beobachtete Wert X ist nicht der wahre Wert τ. Wie groß die Unsicherheit ist, sagt der Standardmessfehler: SEM = σ · √(1 − r_xx). Je unreliabler der Test (kleines r_xx), desto größer der SEM und desto breiter das Intervall. Statt eines einzelnen Punktwerts („der IQ ist 115") gibt man also einen Unsicherheitsbereich an — was dieser Bereich genau besagt, hängt aber von der Methode ab (frequentistisches KI vs. bayesianisches CrI). Genau diesen Unterschied zeigt das Tool.

KI nach Äquivalenzhypothese

Das klassische Konfidenzintervall der KTT, zentriert um den beobachteten Wert X: KI = X ± 1.96 · SEM. Annahme: X ist ein erwartungstreuer Schätzer von τ (Beobachteter = wahrer Wert „im Mittel"). Interpretation frequentistisch: Bei unendlich vielen Wiederholungen enthielte dieses Intervall den wahren Wert in 95 % der Fälle.

KI nach Regressionshypothese

Berücksichtigt die Regression zur Mitte: extreme Testwerte enthalten mehr Messfehler, der beste Schätzer liegt näher am Mittel. τ = μ + r_xx · (X − μ) liegt immer zwischen X und μ; SE_reg = σ · √(r_xx · (1 − r_xx)). Das Intervall ist gegenüber dem Äquivalenz-KI zum Mittelwert verschoben und etwas schmaler. → Regression zur Mitte

Bayesianisches CrI (Credible Interval)

Prior N(μ, SD_prior) + Likelihood N(X, SEM) → Posterior per Präzisionsgewichtung. Der Schätzer τ ist ein gewichtetes Mittel aus μ und X (Gewicht = 1/Varianz). Mit SD_prior = σ·√r_xx stimmt das CrI exakt mit dem Regressions-KI überein; bei flachem Prior nähert es sich dem Äquivalenz-KI. Der Vorteil: direkte Wahrscheinlichkeitsaussagen P(τ > T | X).

Welches Intervall — und wie deuten?

Äquivalenz: wenn man X für unverzerrt hält und nur die Messunsicherheit abbilden will. Regression: wenn man die beste korrigierte Schätzung des wahren Werts braucht (Einzelfalldiagnostik, Verlaufsmessung). Bayes: wenn man Vorwissen einbeziehen und Trennwertfragen direkt beantworten will. Achtung: das frequentistische KI sagt etwas über Wiederholungen, das CrI über die Glaubwürdigkeit beim konkreten Fall.

Einordnung & verwandte Tools

SEM und Reliabilität stammen aus der Klassischen Testtheorie; die Regressionshypothese ist die Anwendung der Regression zur Mitte auf den Einzelfall; das CrI bringt die bayesianische Perspektive (Vorwissen, kein multiples-Testen-Problem bei flexiblen Trennwerten). → KTT-Grundlagen · → Regression zur Mitte

Messfehler
SEM	—
Regressionshypothese
τ̂ (Regressionsschätzer)	—
SE_reg	—
Bayesianischer Posterior
τ̂ (Posterior-Mittelwert)	—
SD_posterior	—
≡ Regressionshypothese (Prior SD ≈ σ·√r_xx)
Beobachtung
Prozentrang (X)	—