| ICC(1) k unterschiedliche Rater Agreement |
ICC(2) gleiche k Rater, Bias = Fehler Agreement |
ICC(3) gleiche k Rater, Bias justiert Consistency |
|
|---|---|---|---|
| Reliabilität des mittleren Raters (?,1) |
|||
| Reliabilität der gemittelten Ratings (?,k) |
ICC(2,1) = σ²_B / (σ²_B + σ²_R + σ²_E). Consistency korrigiert ihn heraus: ICC(3,1) = σ²_B / (σ²_B + σ²_E). Bei großem σ²_R fällt ICC(2) deutlich unter ICC(3). Faustregel: Geht es um absolute Werte (Diagnose-Cutoff), brauchst du Agreement; geht es nur um die Rangordnung, reicht Consistency.ICC(_,1) beschreibt die Reliabilität eines Raters, ICC(_,k) die des Mittelwerts von k Ratern. Mitteln reduziert den Zufallsfehler → die Reliabilität steigt (gleiche Logik wie die Spearman-Brown-Testverlängerung): ICC(3,k) = k·σ²_B / (k·σ²_B + σ²_E). Mehr Rater erhöhen die Reliabilität also dadurch, dass sich der zufällige Fehler (σ²_E) beim Mitteln teilweise herausrechnet. Ein systematischer Rater-Bias (σ²_R) bleibt davon jedoch unberührt — er verschwindet durch Mittelung nicht und drückt die Agreement-ICC weiterhin.E[MQ_zw] = σ²_E + k·σ²_B, E[MQ_rat] = σ²_E + n·σ²_R, E[MQ_res] = σ²_E. Einsetzen und Auflösen ergibt die ICC-Formeln. Die Slider setzen die wahren σ²; jede Stichprobe weicht durch Stichprobenfehler ab und konvergiert erst bei großem n·k.