El poder de la evaluación de expertos: ¿Por qué la validez del contenido es crucial para las pruebas psicológicas?

En psicometría, la validez de contenido (también conocida como validez logística) se refiere al grado en que una herramienta de medición puede representar todos los aspectos de un constructo específico. Por ejemplo, si una herramienta de evaluación de la depresión sólo evalúa los aspectos afectivos de la depresión e ignora los aspectos conductuales, se cuestionará su validez de contenido.

Existe un grado de subjetividad al juzgar la validez del contenido, lo que requiere cierto consenso sobre un rasgo particular de la personalidad, como la extraversión.

La validez de contenido difiere de la validez aparente, que se ocupa de si una prueba parece ser válida a primera vista en lugar de lo que la prueba realmente mide. La validez aparente evalúa si una prueba "parece funcionar", generalmente para los examinados que la realizan, los administradores que deciden utilizar la prueba y otros observadores no técnicos.

La validez de contenido requiere el uso de expertos reconocidos en el campo profesional para evaluar si los elementos de la prueba pueden reflejar completamente el contenido definido y realizar pruebas estadísticas más rigurosas que la validez aparente. La validez de contenido se aplica comúnmente en pruebas académicas y vocacionales donde los elementos de la prueba deben reflejar un área temática específica, como historia, o una habilidad vocacional, como contabilidad.

En un entorno clínico, la validez de contenido se refiere a la correspondencia entre los elementos de la prueba y el contenido de un síndrome.

Método de medición

C.H. Lawshe propuso un método ampliamente utilizado para medir la validez del contenido. Este método se utiliza básicamente para evaluar el grado de acuerdo entre evaluadores o jueces sobre un ítem en particular. En un artículo sobre pruebas previas al empleo, Lawshe (1975) recomendó que cada panelista respondiera la siguiente pregunta para cada ítem: "¿La habilidad o el conocimiento medido por el ítem es 'esencial' para el desempeño laboral?" ¿'innecesario'?"

Según la hipótesis de Lawshe, si más de la mitad de los miembros del panel de expertos creen que un ítem es "necesario", el ítem tiene al menos cierta validez de contenido. El grado de validez de contenido aumenta a medida que más evaluadores coinciden en que un ítem es necesario.

Basándose en estos supuestos, Lawshe desarrolló una fórmula llamada Índice de Validez de Contenido (CVR).

El cálculo de esta fórmula es el siguiente: CVR = (ne - N/2) / (N/2), donde CVR significa índice de validez de contenido, ne es el número de expertos que consideran el elemento "necesario" y N es el número total de expertos en el panel. Los valores de esta fórmula oscilan entre +1 y -1, y los valores positivos indican que al menos la mitad de los expertos creen que el proyecto es necesario. El CVR promedio de todos los ítems también puede considerarse como un indicador de la validez general del contenido de la prueba.

Lawshe (1975) también proporciona una tabla de valores críticos para el CVR para que los evaluadores de las pruebas puedan juzgar si el valor del CVR calculado excede las expectativas aleatorias en función del número de paneles de expertos. La tabla fue calculada por el amigo de Lawshe, Lowell Schipper. Una inspección minuciosa de esta mesa pública reveló una anomalía. En la tabla de Schipper, el valor crítico del CVR aumenta gradualmente cuando el número de expertos se reduce de 40 (mínimo = 0,29) a 9 (mínimo = 0,78), pero inesperadamente disminuye a 8 expertos (mínimo = 0,75), luego alcanza su límite superior (mínimo = .99) con 7 expertos.

Sin embargo, cuando esta fórmula se aplica a 8 evaluadores, el resultado de 7 revisiones "obligatorias" y 1 "otra" generará un valor CVR de 0,75. Si 0,75 no fuera el valor crítico, entonces los 8 evaluadores tendrían que calificarlo como "esencial", lo que daría como resultado un CVR de 1,00. En este caso, para mantener el CVR en orden creciente, su valor necesariamente sería 1,00 en el caso de 8 evaluadores, lo que violaría el mismo principio ya que se tendría el valor "perfecto" requerido para 8 evaluadores, pero no hay correspondientes. valores para otras calificaciones superiores o inferiores a 8 evaluadores.

Wilson, Pan y Schumsky (2012) intentaron corregir este error, pero no encontraron ninguna explicación en el trabajo de Lawshe ni ninguna publicación de Schipper que describiera cómo calcular la tabla de valores críticos. Wilson y sus colegas determinaron que el valor de Schipper se acerca a una aproximación normal de la distribución binomial. Al comparar los valores de Schipper con valores binomiales recién calculados, descubrieron que Lawshe y Schipper etiquetaron erróneamente las tablas que publicaron como pruebas de una cola, cuando en realidad los valores reflejaban los valores de prueba de dos colas de la distribución binomial. Posteriormente, Wilson y sus colegas publicaron un nuevo cálculo de los valores críticos para los índices de validez del contenido y proporcionaron una tabla de valores críticos de pasos unitarios en múltiples niveles alfa.

Conclusión

La validez de contenido desempeña un papel vital en las pruebas psicológicas, ya que garantiza que la prueba evalúe con precisión los constructos necesarios para reflejar situaciones de la vida real. A medida que el uso de pruebas en una variedad de entornos se vuelve más común, el énfasis en la validez del contenido en el mundo profesional y académico se vuelve más evidente. Al considerar futuros diseños de pruebas, deberíamos preguntarnos: ¿Cómo se puede mejorar de manera más efectiva la validez del contenido de las pruebas psicológicas para promover evaluaciones más precisas?

Trending Knowledge

El mito del cálculo de la validez del contenido: ¿Por qué la fórmula de Lawshe es tan crucial y fascinante?
<encabezado> </encabezado> En psicometría, la validez de contenido es la evaluación del grado en que un instrumento de medición representa adecuadamente todos los aspectos
De la superficie a la sustancia: Enfrentando la sorprendente diferencia entre validez y validez de contenido, ¿lo sabías?
En psicometría, la "validez de contenido" (validez de contenido), o validez lógica, se refiere al grado en que una herramienta de medición puede cubrir todos los aspectos de un constructo específico.
El secreto de la validez del contenido: ¿cómo garantizar que los elementos de su prueba reflejen realmente las características psicológicas?
En psicometría, la validez de contenido (también llamada validez lógica) se refiere al grado en que un instrumento de medición representa todos los aspectos de un rasgo psicológico particular. Por eje

Responses