تختلف صلاحية المحتوى عن صلاحية الظاهر، والتي تشير إلى ما إذا كان الاختبار يبدو صالحًا على السطح بدلاً من ما يقيسه بالفعل.
عادةً ما يتطلب تقييم صحة المحتوى من خبراء الموضوع تقييم ما إذا كانت عناصر الاختبار تغطي المحتوى المحدد وإجراء اختبارات إحصائية أكثر صرامة. وتعتبر هذه العملية مهمة بشكل خاص في الاختبارات الأكاديمية والمهنية لأن عناصر الاختبار يجب أن تعكس المعرفة أو المهارات المطلوبة.
في الإطار السريري، يشير مصطلح صلاحية المحتوى إلى درجة التطابق بين عناصر الاختبار ومحتوى الأعراض المحددة. ولضمان صحة الاختبار، من الضروري إجراء تحليل معمق لمعرفة ما إذا كانت عناصر الاختبار قادرة على عكس تنوع الأعراض بشكل كامل.
اقترح C.H. Lawshe مقياسًا واسع الاستخدام لصلاحية المحتوى، وهو مقياس للاتفاق بين المراجعين حول أهمية عنصر معين.
في مقال نُشر عام 1975، اقترح لاوشي أن يجيب كل خبير في الموضوع عن كل بند فيما إذا كانت المهارة أو المعرفة "أساسية" أو "مفيدة ولكن ليست أساسية" لأداء الوظيفة. أو "غير ضرورية"؟ وفقًا للوشي، إذا اعتبر أكثر من نصف المراجعين أن عنصرًا ما ضروريًا، فهذا العنصر يتمتع على الأقل ببعض صلاحية المحتوى.
استنادًا إلى هذه الافتراضات، طوّر لاوشي صيغة تُسمى نسبة صلاحية المحتوى (CVR) لقياس صلاحية المحتوى.
الصيغة هي كما يلي: CVR = (ne - N/2) / (N/2)
، حيث CVR هي نسبة صلاحية المحتوى وne هو عدد الخبراء الذين أشاروا إلى "ضرورة "، N هو العدد الإجمالي للخبراء. تأخذ الصيغة قيمًا بين +1 و -1؛ القيمة الإيجابية تعني أن نصف الخبراء على الأقل يعتقدون أن العنصر ضروري.
حاول بعض الباحثين تحسين هذا النموذج ووجدوا أن جدول لاوشي وشيبر تم تسميته خطأً بأنه اختبار ذو ذيل واحد، في حين أنه في الواقع يتوافق مع تقريب طبيعي لاختبار ذو ذيلين.
كما أشار ويلسون وبان وشومسكي وآخرون في دراستهم، فإن نسبة صلاحية جدول القيمة الحرجة المعاد حسابها يمكن أن تعكس بشكل أفضل صحة القياس وتوفر قيمًا حرجة عند مستويات أهمية مختلفة. إن هذه المراجعة لا تجعل تقييم صحة المحتوى أكثر دقة فحسب، بل تمكن الباحثين في المستقبل أيضًا من تصميم اختبارات تعتمد على بيانات أكثر صلابة.
بينما نحاول باستمرار تحسين صحة المحتوى في الممارسة العملية، فمن الأهمية بمكان فهم المعنى وراء كل عنصر اختبار. وخاصة في علم النفس وغيره من المجالات ذات الصلة، لن يقتصر الاختبار الفعال على الصلاحية السطحية في الظاهر، بل سيضمن تمثيل جميع السمات النفسية بشكل كامل.
إن صلاحية المحتوى لا تعتبر معيار اختبار فحسب، بل تتعلق أيضًا بكيفية فهم وقياس الظواهر النفسية التي ندرسها بشكل صحيح. سوف تصبح مسألة إمكانية تطبيق مبادئ صحة المحتوى بشكل مناسب في مواقف مختلفة قضية تستحق الاستكشاف المتعمق في علم القياس النفسي في المستقبل.