مع تطور العلوم والتكنولوجيا، يتم استبدال أساليب القياس النفسي التقليدية بتقنيات جديدة. وتحظى اختبارات التصنيف المحوسبة (CCT)، كنظام تقييم جديد، باهتمام متزايد. فهو لا يبسط عملية الاختبار فحسب، بل يحسن أيضًا دقة وكفاءة الاختبار. إذن، كيف يعمل CCT؟ ما هي النظريات والممارسات المخفية وراء ذلك؟
الاختبار التصنيفي المحوسب هو نظام تقييم يعتمد على الكمبيوتر ومصمم لتصنيف المرشحين.
تعمل اختبارات CCT بطريقة مماثلة للاختبار التكيفي المحوسب (CAT)، حيث يتم طرح الأسئلة على المرشحين واحدًا تلو الآخر، وبعد الإجابة على كل سؤال، يقوم الكمبيوتر على الفور بتقييمه وتقييم ما إذا كان المرشح قد تم تصنيفه. إذا كان الأمر كذلك، يتم إنهاء الاختبار ويتم تصنيف المرشح، وإذا لم يكن الأمر كذلك، يتم تقديم السؤال التالي. تتكرر هذه العملية حتى يتم تصنيف المرشح أو استيفاء المعايير النهائية الأخرى (مثل الإجابة على جميع الأسئلة أو الوصول إلى الحد الأقصى لطول الاختبار).
هناك نوعان رئيسيان من النماذج النفسية القياسية لـ CCT: نظرية الاختبار الكلاسيكي (CTT) ونظرية الاستجابة للعنصر (IRT). يصنف النموذج الأول المرشحين في عينة محددة ويحدد صعوبة كل سؤال وتمييزه على أساس مجموعات مختلفة من المرشحين، لكن هذا يفرض مطالب عالية على اختيار المرشحين. في المقابل، يفترض IRT أن القدرة مستمرة وأن معايير التصنيف قد تكون غامضة ولكنها أكثر دقة. هناك اعتبارات مختلفة في الاختيار بين هذين النهجين، حيث يوفر CTT البساطة المفاهيمية بينما يوفر IRT مزيدًا من الخصوصية عندما تكون الموارد كافية.
على الرغم من أن CTT بسيط نسبيًا، إلا أنه يمكن أن يكون أكثر كفاءة في معايرة معلمات الاختبار لخطط الاختبار الصغيرة.
يجب ضبط CCT على نقطة بداية محددة لتشغيل خوارزمية محددة. إذا كنت تستخدم اختبار نسبة الاحتمالية المتسلسلة كمعيار توقف، فإن نسبة البداية الافتراضية هي 1.0؛ إذا كنت تستخدم طريقة الفاصل الزمني للثقة، فيجب عليك تحديد نقطة البداية. عادةً ما تكون نقطة البداية هذه 0.0، مما يشير إلى مركز التوزيع؛ ومع ذلك، من الممكن أيضًا تعيين نقطة البداية استنادًا إلى البيانات التاريخية للمرشح.
في CCT، يكون اختيار الأسئلة مرنًا. وبالمقارنة بالطريقة التقليدية التي تستخدم مجموعات أسئلة ثابتة لجميع المرشحين، يمكن تعديل الأسئلة باستمرار وفقًا لأداء المرشحين. يمكن تقسيم طرق اختيار الأسئلة بشكل رئيسي إلى فئتين: الاختيار على أساس الدرجة المقطوعة والاختيار على أساس التقدير. يعمل الخيار الأول على تعظيم المعلومات المقدمة حول درجة القطع، في حين يتخذ الخيار الثاني خيارات بناءً على التقديرات الحالية لقدرة الممتحن، وستختلف كفاءة هذين الخيارين اعتمادًا على معايير التوقف المستخدمة.
اعتمادًا على معايير الإنهاء المستخدمة، فإن اختيار الأسئلة في الوقت المناسب سيؤثر بشكل مباشر على نجاح الاختبار.
هناك ثلاثة معايير إنهاء تستخدم غالبًا في CCT: نظرية القرار البايزية، وطريقة الفاصل الزمني للثقة، واختبار نسبة الاحتمال التسلسلي. تتمتع كل من هذه الطرق بمزاياها وعيوبها الخاصة، حيث توفر درجات متفاوتة من المرونة والدقة، ولكنها قد تؤدي أيضًا إلى إدخال بعض الذاتية غير الضرورية. وبموجب طريقة الفاصل الزمني للثقة، فإن تقدير الممتحن الحالي للقدرة له تأثير مباشر على نتيجة التصنيف، في حين يقوم اختبار نسبة الاحتمالية المتسلسلة بإجراء التصنيف في شكل اختبار فرضية.
مع تطور العصر، لم يعمل CCT على إرساء معيار اختبار فعال فحسب، بل كان له أيضًا تأثير عميق على مستقبل مجال القياس النفسي. مع استمرار توسع تطبيقاتها العملية، كيف ستؤثر على أساليب الاختبار لدينا وفهم الناس لتقييم القدرات في المستقبل؟ هذا أمر يستحق أن يفكر فيه كل منا.