De la surface à la substance : face à la différence surprenante entre validité et validité de contenu, le saviez-vous ?

En psychométrie, la « validité du contenu » (validité du contenu), ou validité logique, fait référence à la mesure dans laquelle un outil de mesure peut couvrir tous les aspects d'une construction spécifique. Par exemple, une échelle de dépression qui évalue uniquement la dimension affective mais ignore la dimension comportementale peut être considérée comme manquant de validité de contenu. Il existe une certaine part de subjectivité dans le jugement de la validité du contenu, ce qui nécessite un certain degré de consensus sur un trait de personnalité particulier (comme l’extraversion). S’il y a désaccord sur un trait de personnalité particulier, une validité de contenu élevée ne peut pas être atteinte.

La validité du contenu diffère de la validité apparente, qui fait référence à ce qu'un test semble mesurer plutôt qu'à ce qu'il mesure réellement.

Dans les applications de test, la validité apparente évalue si un test « semble valide » pour les participants, les administrateurs et d'autres observateurs non experts techniquement. La validité du contenu, en revanche, nécessite la mobilisation d’experts reconnus en la matière pour évaluer si les éléments du test évaluent le contenu défini, et ce processus d’évaluation nécessite des tests statistiques plus rigoureux que la validité apparente. La validité du contenu se retrouve le plus souvent dans les tests académiques et professionnels, où les éléments de test doivent refléter les connaissances réelles requises pour un domaine d'étude (comme l'histoire) ou une compétence professionnelle (comme la comptabilité).

Dans les applications cliniques, la validité du contenu fait référence à la correspondance entre les éléments de test et le contenu des symptômes d'un syndrome.

Méthodes de mesure de la validité du contenu

Une méthode largement utilisée pour évaluer la validité du contenu a été proposée par C. H. Lawshe. Il s’agit essentiellement d’une manière d’évaluer la cohérence de l’importance que les examinateurs ou les évaluateurs accordent à un élément. Lawshe (1975) a recommandé que les experts en la matière (EM) participant à l'examen répondent à la question suivante pour chaque élément : « La compétence ou la connaissance mesurée par l'élément est-elle « essentielle » à l'exécution du travail, « utile mais pas essentielle » ? ", ou "utile mais pas nécessaire" à l'exécution du travail ? " Selon Lawshe, si plus de la moitié des évaluateurs déclarent qu'un élément est nécessaire, alors l'élément a au moins une certaine validité de contenu. Lorsque davantage d’examinateurs conviennent qu’un élément est nécessaire, le degré de validité du contenu est plus élevé.

En utilisant ces hypothèses, Lawshe a développé une formule appelée le ratio de validité du contenu.

L'expression de cette formule est :

CVR = (ne - N/2) / (N/2)

Où CVR signifie ratio de validité du contenu, ne est le nombre d'experts en la matière marqués comme « nécessaires » et N est le nombre total d'experts en la matière. Cette formule produit des valeurs allant de +1 à -1, les valeurs positives indiquant qu'au moins la moitié des experts ont évalué l'élément comme nécessaire. Le CVR moyen des éléments peut être utilisé pour indiquer la validité du contenu du test global.

Lawshe (1975) a fourni un tableau de seuils CVR que les évaluateurs de tests peuvent utiliser pour déterminer la taille du CVR calculé nécessaire pour atteindre la probabilité attendue d'une percée étant donné un nombre donné d'experts en la matière. Un examen plus approfondi de ce tableau publié révèle une anomalie. Dans le tableau de Schipper, la valeur critique du CVR augmente de manière monotone de 40 experts (minimum = 0,29) à 9 experts (minimum = 0,78), mais diminue soudainement à 8 experts (la valeur minimale est de 0,75), et la valeur la plus élevée est atteinte dans le cas de 7 experts (la valeur minimale est de 0,99). Cependant, lorsque la formule a été appliquée à 8 évaluateurs, les données de 7 évaluateurs qui l’ont marquée comme nécessaire et d’un évaluateur qui l’a marquée différemment ont donné lieu à un CVR de 0,75. Si 0,75 n’est pas la valeur critique, alors 8 personnes seraient nécessaires pour les marquer comme nécessaires afin d’obtenir un CVR de 1,00. Dans ce cas, dans l'ordre croissant du CVR, 8 évaluateurs et leur valeur devraient être de 1,00, ce qui violerait le même principe, car la valeur « parfaite » pour 8 évaluateurs ne s'appliquerait pas à d'autres nombres d'évaluateurs.

On ne sait pas si cet écart par rapport au modèle monotone croissant du reste du tableau est dû à une erreur de calcul de Schipper ou à une erreur de frappe ou de composition. Wilson, Pan et Schumsky ont tenté de corriger l'erreur en 2012, mais n'ont pas pu trouver d'explication dans l'article de Lawshe, ni de publication de Schipper expliquant le processus de calcul du tableau des valeurs critiques. Les chercheurs estiment que la valeur de Schipper est proche de l’approximation normale de la distribution binomiale. En comparant les valeurs de Schipper avec les valeurs binomiales nouvellement calculées, ils ont découvert que Lawshe et Schipper avaient incorrectement étiqueté les tables publiques comme des tests à une queue, alors qu'en fait les valeurs reflétaient les valeurs binomiales d'un test à deux queues. Par la suite, Wilson et ses collègues ont publié un tableau de valeurs critiques recalculées pour les ratios de validité du contenu, fournissant des valeurs critiques à plusieurs niveaux de signification.

La discussion approfondie sur la validité du contenu a non seulement des implications importantes pour la conception des tests, mais favorise également l’émergence de nouveaux modèles de pensée en psychométrie. Dans le même temps, devrions-nous repenser la manière de mesurer efficacement l’efficacité des tests afin qu’ils puissent être appliqués plus judicieusement dans diverses situations réelles ?

Trending Knowledge

Le mythe du calcul de la validité du contenu : pourquoi la formule de Lawshe est-elle si cruciale et fascinante ?
<en-tête> </header> En psychométrie, la validité du contenu est l’évaluation de la mesure dans laquelle un instrument de mesure représente adéquatement tous les aspects d’
Le pouvoir de l'évaluation par des experts : pourquoi la validité du contenu est cruciale pour les tests psychologiques ?
En psychométrie, la validité de contenu (également connue sous le nom de validité logistique) fait référence à la mesure dans laquelle un outil de mesure peut représenter tous les aspects d'un concept
Le secret de la validité du contenu : comment garantir que vos éléments de test reflètent réellement les caractéristiques psychologiques ?
En psychométrie, la validité du contenu (également appelée validité logique) fait référence à la mesure dans laquelle un instrument de mesure représente tous les aspects d'un trait psychologique parti

Responses