Le pouvoir de l'évaluation par des experts : pourquoi la validité du contenu est cruciale pour les tests psychologiques ?

En psychométrie, la validité de contenu (également connue sous le nom de validité logistique) fait référence à la mesure dans laquelle un outil de mesure peut représenter tous les aspects d'un concept spécifique. Par exemple, si un outil d’évaluation de la dépression évalue uniquement les aspects affectifs de la dépression et ignore les aspects comportementaux, la validité de son contenu sera remise en question.

Il existe un certain degré de subjectivité dans le jugement de la validité du contenu, qui nécessite un certain consensus sur un trait de personnalité particulier, comme l'extraversion.

La validité de contenu diffère de la validité apparente, qui concerne la question de savoir si un test semble valide à première vue plutôt que ce qu'il mesure réellement. La validité apparente évalue si un test « semble fonctionner », généralement aux yeux des candidats qui passent le test, des administrateurs qui décident de l'utiliser et d'autres observateurs non techniques.

La validité du contenu nécessite le recours à des experts reconnus dans le domaine professionnel pour évaluer si les éléments du test peuvent refléter pleinement le contenu défini et effectuer des tests statistiques plus rigoureux que la validité apparente. La validité du contenu est couramment appliquée dans les tests académiques et professionnels où les éléments du test doivent refléter un domaine spécifique, tel que l'histoire, ou une compétence professionnelle, telle que la comptabilité.

Dans un contexte clinique, la validité du contenu concerne la correspondance entre les éléments de test et le contenu d'un syndrome.

Méthode de mesure

C.H. Lawshe a proposé une méthode largement utilisée pour mesurer la validité du contenu. Cette méthode est essentiellement utilisée pour évaluer le degré d’accord entre les évaluateurs ou les juges sur un élément particulier. Dans un article sur les tests préalables à l'emploi, Lawshe (1975) a recommandé que chaque panéliste réponde à la question suivante pour chaque élément : « La compétence ou les connaissances mesurées par l'élément sont-elles « essentielles » au rendement au travail ? "inutile" ?"

Selon l'hypothèse de Lawshe, si plus de la moitié des membres du panel d'experts estiment qu'un élément est « nécessaire », cet élément a au moins une certaine validité de contenu. Le degré de validité du contenu augmente à mesure que davantage d’évaluateurs conviennent qu’un élément est nécessaire.

Sur la base de ces hypothèses, Lawshe a développé une formule appelée ratio de validité du contenu (CVR).

Le calcul de cette formule est le suivant : CVR = (ne - N/2) / (N/2), où CVR signifie le taux de validité du contenu, ne est le nombre d'experts qui considèrent l'élément "nécessaire", et N est le nombre total de experts du panel. Les valeurs de cette formule vont de +1 à -1, les valeurs positives indiquant qu'au moins la moitié des experts estiment que le projet est nécessaire. Le CVR moyen de tous les items peut également être considéré comme un indicateur de la validité globale du contenu du test.

Lawshe (1975) fournit également un tableau de valeurs critiques pour le CVR afin que les évaluateurs de tests puissent juger si la valeur CVR calculée dépasse les attentes aléatoires en fonction du nombre de panels d'experts. Le tableau a été calculé par l'ami de Lawshe, Lowell Schipper. Une inspection minutieuse de cette table publique a révélé une anomalie. Dans le tableau de Schipper, la valeur critique du CVR augmente progressivement lorsque le nombre d'experts est réduit de 40 (minimum = 0,29) à 9 (minimum = 0,78), mais diminue de manière inattendue à 8 experts (minimum = 0,75), puis atteint sa limite supérieure (minimum = 0,99) avec 7 experts.

Cependant, lorsque cette formule est appliquée à 8 évaluateurs, le résultat de 7 avis « obligatoires » et 1 « autre » générera une valeur CVR de 0,75. Si 0,75 n'était pas la valeur critique, alors les huit évaluateurs devraient la noter « essentiel », ce qui entraînerait un CVR de 1,00. Dans ce cas, pour garder le CVR dans l'ordre croissant, sa valeur serait nécessairement de 1,00 dans le cas de 8 évaluateurs, ce qui violerait le même principe puisque vous auriez la valeur "parfaite" requise pour 8 évaluateurs, mais il n'y a pas de valeur correspondante. valeurs pour les autres notes supérieures ou inférieures à 8 évaluateurs.

Wilson, Pan et Schumsky (2012) ont tenté de corriger cette erreur, mais n'ont trouvé aucune explication dans le travail de Lawshe, ni aucune publication de Schipper décrivant comment calculer le tableau des valeurs critiques. Wilson et ses collègues ont déterminé que la valeur de Schipper est proche d'une approximation normale de la distribution binomiale. En comparant les valeurs de Schipper avec les valeurs binomiales nouvellement calculées, ils ont découvert que Lawshe et Schipper avaient mal étiqueté les tableaux qu'ils avaient publiés comme des tests unilatéraux, alors qu'en fait les valeurs reflétaient les valeurs de test bilatéral de la distribution binomiale. Par la suite, Wilson et ses collègues ont publié un recalcul des valeurs critiques pour les ratios de validité du contenu et ont fourni un tableau des valeurs critiques unitaires à plusieurs niveaux alpha.

Conclusion

La validité du contenu joue un rôle essentiel dans les tests psychologiques, car elle garantit que le test évalue avec précision les concepts requis pour refléter des situations réelles. À mesure que l’utilisation des tests dans divers contextes devient plus courante, l’accent mis sur la validité du contenu dans le monde professionnel et universitaire devient plus évident. Lorsque nous envisageons de futurs modèles de tests, nous devrions nous demander : comment améliorer plus efficacement la validité du contenu des tests psychologiques pour promouvoir des évaluations plus précises ?

Trending Knowledge

Le mythe du calcul de la validité du contenu : pourquoi la formule de Lawshe est-elle si cruciale et fascinante ?
<en-tête> </header> En psychométrie, la validité du contenu est l’évaluation de la mesure dans laquelle un instrument de mesure représente adéquatement tous les aspects d’
De la surface à la substance : face à la différence surprenante entre validité et validité de contenu, le saviez-vous ?
En psychométrie, la « validité du contenu » (validité du contenu), ou validité logique, fait référence à la mesure dans laquelle un outil de mesure peut couvrir tous les aspects d'une construction spé
Le secret de la validité du contenu : comment garantir que vos éléments de test reflètent réellement les caractéristiques psychologiques ?
En psychométrie, la validité du contenu (également appelée validité logique) fait référence à la mesure dans laquelle un instrument de mesure représente tous les aspects d'un trait psychologique parti

Responses