من السطح إلى الجوهر: مواجهة الفرق المذهل بين الصلاحية وصلاحية المحتوى، هل تعلم؟

في علم القياس النفسي، يشير "صلاحية المحتوى" (صلاحية المحتوى)، أو الصلاحية المنطقية، إلى المدى الذي يمكن فيه لأداة القياس تغطية جميع جوانب بناء معين. على سبيل المثال، قد يُعتبر مقياس الاكتئاب الذي يقيم البعد العاطفي فقط ويتجاهل البعد السلوكي أنه يفتقر إلى صحة المحتوى. هناك قدر معين من الذاتية في الحكم على صحة المحتوى، الأمر الذي يتطلب درجة معينة من الإجماع على سمة شخصية معينة (مثل الانفتاح). إذا كان هناك خلاف حول سمة شخصية معينة، فلا يمكن الوصول إلى درجة عالية من صحة المحتوى.

تختلف صلاحية المحتوى عن صلاحية الظاهر، والتي تشير إلى ما يبدو أن الاختبار يقيسه وليس ما يقيسه الاختبار بالفعل.

في تطبيقات الاختبار، يتم تقييم مدى صلاحية الاختبار من حيث ما إذا كان "يبدو صالحًا" للمشاركين والإداريين وغيرهم من المراقبين غير الخبراء من الناحية التقنية. من ناحية أخرى، تتطلب صلاحية المحتوى حشد خبراء معترف بهم في الموضوع لتقييم ما إذا كانت عناصر الاختبار تقيم المحتوى المحدد، وتتطلب عملية التقييم هذه اختبارات إحصائية أكثر صرامة من صلاحية الوجه. توجد صلاحية المحتوى بشكل شائع في الاختبارات الأكاديمية والمهنية، حيث يجب أن تعكس عناصر الاختبار المعرفة الفعلية المطلوبة لمجال دراسي (مثل التاريخ) أو مهارة مهنية (مثل المحاسبة).

في التطبيقات السريرية، يشير مصطلح صلاحية المحتوى إلى المراسلات بين عناصر الاختبار ومحتوى الأعراض لمتلازمة ما.

طرق قياس صلاحية المحتوى

اقترح C. H. Lawshe طريقة واسعة الاستخدام لتقييم صحة المحتوى. إنها في الأساس طريقة لتقييم مدى اتساق الأهمية التي يوليها المراجعون أو المقيمون لعنصر ما. أوصى لاوشي (1975) بأن يجيب خبراء الموضوع المشاركين في المراجعة على السؤال التالي لكل عنصر: "هل المهارة أو المعرفة التي يقيسها العنصر" ضرورية "لأداء الوظيفة، أو" مفيدة ولكنها ليست أساسية " "أو "مفيد ولكن ليس ضروريًا" لأداء الوظيفة؟" وفقًا لـ Lawshe، إذا قال أكثر من نصف المراجعين إن العنصر ضروري، فهذا يعني أن العنصر يتمتع ببعض صلاحية المحتوى على الأقل. عندما يتفق عدد أكبر من المراجعين على أن أحد العناصر ضروري، تكون درجة صحة المحتوى أعلى.

وباستخدام هذه الافتراضات، طور لاوشي صيغة تسمى نسبة صحة المحتوى.

تعبير هذه الصيغة هو:

CVR = (ne - N/2) / (N/2)

حيث يشير CVR إلى نسبة صحة المحتوى، وne هو عدد خبراء الموضوع الذين تم وضع علامة "ضرورية" عليهم، وN هو العدد الإجمالي لخبراء الموضوع. تنتج هذه الصيغة قيمًا تتراوح من +1 إلى -1، حيث تشير القيم الإيجابية إلى أن نصف الخبراء على الأقل قاموا بتقييم العنصر على أنه ضروري. يمكن استخدام متوسط ​​​​CVR للعناصر للإشارة إلى صحة محتوى الاختبار الإجمالي.

قدم Lawshe (1975) جدولاً لعتبات CVR التي يمكن لمقيِّمي الاختبار استخدامها لتحديد حجم CVR المحسوب المطلوب لتحقيق الاحتمالية المتوقعة للاختراق بالنظر إلى عدد معين من خبراء الموضوع. إن إلقاء نظرة فاحصة على هذا الجدول المنشور يكشف عن وجود خلل. في جدول شيبر، تزداد القيمة الحرجة لـ CVR بشكل رتيب من 40 خبيرًا (الحد الأدنى = 0.29) إلى 9 خبراء (الحد الأدنى = 0.78)، ولكنها تنخفض فجأة عند 8 خبراء (القيمة الدنيا هي 0.75)، ويتم الوصول إلى أعلى قيمة في حالة 7 خبراء (القيمة الدنيا هي 0.99). ومع ذلك، عندما تم تطبيق الصيغة على 8 مراجعين، أدت البيانات من 7 مراجعين قاموا بتمييزها على أنها ضرورية ومراجع واحد قام بتمييزها بشكل مختلف إلى معدل تحويل 0.75. إذا لم تكن 0.75 هي القيمة الحرجة، فسيكون هناك حاجة إلى 8 أشخاص لوضع علامة عليها باعتبارها ضرورية من أجل استنتاج CVR بقيمة 1.00. في هذه الحالة، بالترتيب التصاعدي لـ CVR، 8 مراجعين وقيمتهم يجب أن تكون 1.00، وهو ما ينتهك نفس المبدأ، حيث أن القيمة "المثالية" لـ 8 مراجعين لن تنطبق على أعداد أخرى من المراجعين.

من غير الواضح ما إذا كان هذا الانحراف عن النمط المتزايد بشكل رتيب لبقية الجدول يرجع إلى خطأ حسابي من جانب شيبر أو خطأ في الطباعة أو التركيب. حاول ويلسون وبان وشومسكي تصحيح الخطأ في عام 2012، ولكنهم لم يتمكنوا من العثور على تفسير في ورقة لاوشي، ولم يكن هناك منشور لشيبر لشرح عملية حساب جدول القيمة الحرجة. ويعتقد الباحثون أن قيمة شيبر قريبة من التقريب الطبيعي للتوزيع الثنائي. وبمقارنة قيم شيبر مع القيم الثنائية المحسوبة حديثًا، اكتشفوا أن لاوشي و شيبر قاموا بشكل غير صحيح بتسمية الجداول العامة بأنها اختبارات ذات ذيل واحد، بينما في الواقع كانت القيم تعكس القيم الثنائية لاختبار ذي ذيلين. وبعد ذلك، نشر ويلسون وزملاؤه جدولاً للقيم الحرجة المعاد حسابها لنسب صحة المحتوى، مما يوفر قيمًا حرجة عند مستويات دلالة متعددة.

إن المناقشة المتعمقة لموضوع صلاحية المحتوى ليس لها آثار مهمة على تصميم الاختبار فحسب، بل إنها تعمل أيضًا على تعزيز ظهور أنماط تفكير جديدة في القياس النفسي. وفي هذه العملية، هل ينبغي لنا أن نعيد التفكير في كيفية قياس فعالية الاختبارات بشكل فعال بحيث يمكن تطبيقها بحكمة أكبر في مختلف المواقف الواقعية؟

Trending Knowledge

أسطورة حساب صلاحية المحتوى: لماذا تعتبر صيغة لاوشي حاسمة ورائعة للغاية؟
<الرأس> </header> في علم القياس النفسي، صلاحية المحتوى هي تقييم مدى تمثيل أداة القياس بشكل كافٍ لجميع جوانب البناء. على سبيل المثال، إذا كان مقياس الاكتئاب يقيم الجوانب ال
قوة تقييم الخبراء: لماذا تعد صلاحية المحتوى أمرًا بالغ الأهمية للاختبارات النفسية؟
في القياس النفسي، تشير صلاحية المحتوى (المعروفة أيضًا باسم الصلاحية اللوجستية) إلى المدى الذي يمكن أن تمثله أداة القياس جميع جوانب بنية معينة. على سبيل المثال، إذا قامت أداة تقييم الاكتئاب بتقييم الجو
سر صحة المحتوى: كيف تتأكد من أن عناصر الاختبار الخاصة بك تعكس الخصائص النفسية فعليًا؟
في علم القياس النفسي، يشير مصطلح صلاحية المحتوى (وتسمى أيضًا الصلاحية المنطقية) إلى المدى الذي تمثل فيه أداة القياس جميع جوانب سمة نفسية معينة. على سبيل المثال، إذا كان مقياس الاكتئاب يقيم الجوانب الع

Responses