Corrections

Le Coefficient Kappa

	Introduction
	Définition de l'accord
	Accord entre 2 juges
	Accord entre plusieurs juges
	Limites du test
	Usages du test
	Applications pratiques
	Conclusion
	Annexes

Références

Téléchargement

Liens Internet

Note de l'auteur

Contact

Limites du test

	Sensibilité aux erreurs systématiques entre les juges
	Sensibilité à la prévalence du signe cherché
	Corrections proposées

De nombreux auteurs ont proposé des indices pour estimer l’accord entre des jugements catégoriels qui reposent pour la plupart sur le modèle suivant :

avec

I : une statistique d’accord sur un tableau de contingence

I_o : l’accord observé

I_e : la valeur attendue sous l’hypothèse de l’indépendance des jugements (H_e)

I_max : la valeur maximale que peut prendre I

M(I) : une statistique d’accord corrigée de l’accord sous H_e

La principale différence entre ces indices concerne l’estimation de la concordance aléatoire I_e.

Scott^[1⁵^], en 1955, propose l’index d’accord P avec :

L’indice de Scott apparaît en fait comme un cas particulier du coefficient Kappa où l’on suppose l’égalité des marginales.

Bennet^[1⁶^], en 1954, propose un coefficient S pour lequel I_e est toujours égale à 0,5.

Cicchetti et Feinstein^[1⁷^] ont proposé des corrections aux limites du test Kappa, puis Byrt^[1⁸^], en 1993, présente un nouveau test PABAK dérivé de Kappa qui équilibre les effectifs concordants et les effectifs discordants du tableau de contingence. Finalement le test PABAK est identique à l’index G proposé par Holley et Guilford^[1⁹^] en 1964 dans le cas d’un tableau 2´2 :

qui peut être généralisé pour r modalités de jugement :

Il faut noter d’autre part, que la formulation du test Kappa multi-juges proposée par Fleiss corrige le biais puisqu’elle fait l’hypothèse de l’égalité des marginales.

Méthode de Hui et Walter

Pour tout savoir ou presque sur le test statistique Kappa...