En psicometría, la validez de contenido es la evaluación del grado en que un instrumento de medición representa adecuadamente todos los aspectos de un constructo. Por ejemplo, si una escala de depresión sólo evalúa aspectos afectivos pero ignora los aspectos conductuales, la escala puede carecer de validez de contenido. La subjetividad involucrada hace que la determinación de la validez del contenido sea menos clara, ya que las interpretaciones de rasgos de personalidad específicos, como la extroversión, a menudo difieren. Si existen diferencias en la comprensión de un rasgo de personalidad entre los expertos, será difícil lograr una alta validez de contenido.
La validez de contenido es diferente de la validez aparente. La validez aparente sólo evalúa si una prueba parece ser válida, pero no refleja realmente lo que mide.La validez aparente se centra en si una prueba parece "funcionar" para los examinados, los administradores y otros observadores técnicamente no sofisticados. Por ejemplo, cuando los candidatos ven un material, ¿piensan que pone a prueba sus conocimientos o habilidades? Por el contrario, la validez de contenido requiere el uso de revisores de contenido profesionales para evaluar si los elementos de la prueba reflejan el contenido definido y también requiere pruebas estadísticas más rigurosas que la validez aparente. La validez de contenido se cita a menudo en el contexto de pruebas académicas y vocacionales porque los elementos de prueba deben reflejar el conocimiento requerido para un campo profesional específico (por ejemplo, historia) o una habilidad laboral (por ejemplo, contabilidad). En un entorno clínico, la validez de contenido se refiere a la correspondencia entre los elementos de prueba y el contenido de la enfermedad.
El método de medición de la validez de contenido propuesto por Lawshe evalúa principalmente el grado de acuerdo entre evaluadores y todavía se utiliza ampliamente en la actualidad.
Un famoso método propuesto por Lawshe en 1975 para evaluar las opiniones de los revisores sobre si un proyecto es "necesario". Según Lawshe, cada revisor experto responde a la pregunta para cada ítem de la prueba: "¿La habilidad o el conocimiento medido por el ítem es 'esencial', 'útil pero no esencial' o 'innecesario'?" Si más de la mitad de los revisores cree que un ítem es esencial, entonces el ítem tiene al menos cierto grado de validez de contenido. A medida que más revisores coinciden en la necesidad de un artículo, el grado de validez del contenido aumenta en consecuencia. Por lo tanto, Lawshe desarrolló una fórmula llamada índice de validez de contenido.
La razón de validez de contenido se calcula entre +1 y -1, donde los valores positivos indican que al menos la mitad de los revisores expertos consideran que el ítem es obligatorio.
Al explorar más a fondo el método de Lawshe, los investigadores encontraron algunas variaciones inusuales en el índice mínimo de validez de contenido requerido cuando se utilizan ocho revisores. Este fenómeno atrajo la atención de estudiosos como Wilson, Pan y Schumsky, quienes propusieron una reevaluación de estos valores en 2012. Al comparar los valores de la distribución binomial que calcularon con los valores de Schipper, los académicos encontraron que la tabla marcada por Lawshe y Schipper era en realidad el resultado de una prueba de dos colas, pero estaba mal etiquetada como una prueba de una cola, lo que causó confusión sobre los valores originales. Estos errores hacen que los valores críticos de los índices de validez de contenido sean inconsistentes cuando se calculan utilizando diferentes números de revisores.
Por lo tanto, la reevaluación de los índices de validez de contenido es crucial. Este proceso de recálculo proporciona información valiosa que nos permite examinar la importancia y el impacto de la validez del contenido dentro de un nuevo marco de comprensión. Esta serie de estudios no sólo revela posibles sesgos en el diseño y la evaluación de pruebas, sino que también incita a la comunidad académica a reflexionar sobre la confiabilidad y validez de la medición de contenido.
Desde la teoría hasta la práctica, el índice de validez de contenido de Lawshe no es sólo un conjunto de números, es también una garantía de que la prueba que utilizamos puede reflejar verdaderamente los rasgos de personalidad o los estándares de comportamiento que nos interesan.
Cuando discutimos la cuestión de la validez del contenido, no podemos evitar preguntarnos: ¿cómo podemos encontrar un equilibrio entre subjetividad y objetividad, y así mejorar nuestra confianza en los resultados de las pruebas?