Với sự phát triển của khoa học và công nghệ, các phương pháp đo lường tâm lý truyền thống đang được thay thế bằng các công nghệ mới. Các bài kiểm tra phân loại trên máy tính (CCT), như một hệ thống đánh giá mới, đang ngày càng được chú ý. Nó không chỉ đơn giản hóa quá trình thử nghiệm mà còn cải thiện độ chính xác và hiệu quả của thử nghiệm. Vậy CCT hoạt động như thế nào? Những lý thuyết và thực hành nào ẩn chứa đằng sau nó?
Bài kiểm tra phân loại trên máy tính là hệ thống đánh giá dựa trên máy tính được thiết kế để phân loại ứng viên.
CCT hoạt động theo cách tương tự như bài kiểm tra thích ứng trên máy tính (CAT), trong đó các câu hỏi được đưa ra cho từng ứng viên một và sau khi ứng viên trả lời xong từng câu hỏi, máy tính sẽ ngay lập tức chấm điểm và đánh giá xem ứng viên đã được phân loại hay chưa. Nếu vậy, bài kiểm tra sẽ kết thúc và ứng viên sẽ được phân loại; nếu không, câu hỏi tiếp theo sẽ được đưa ra. Quá trình này lặp lại cho đến khi ứng viên được phân loại hoặc đáp ứng các tiêu chí cuối cùng khác (chẳng hạn như đã trả lời hết tất cả các câu hỏi hoặc đạt đến giới hạn độ dài bài kiểm tra).
Có hai loại mô hình trắc nghiệm tâm lý chính cho CCT: lý thuyết kiểm tra cổ điển (CTT) và lý thuyết phản hồi câu hỏi (IRT). Phương pháp đầu tiên phân loại ứng viên theo một mẫu cụ thể và xác định mức độ khó cũng như tính phân biệt của từng câu hỏi dựa trên các nhóm ứng viên khác nhau, nhưng phương pháp này đặt ra yêu cầu cao trong việc lựa chọn ứng viên. Ngược lại, IRT cho rằng khả năng là liên tục và tiêu chí phân loại có thể mơ hồ nhưng chính xác hơn. Có nhiều cân nhắc khác nhau khi lựa chọn giữa hai cách tiếp cận này, trong đó CTT mang lại sự đơn giản về mặt khái niệm và IRT mang lại tính cụ thể hơn khi có đủ nguồn lực.
Mặc dù CTT tương đối đơn giản, nhưng nó có thể hiệu quả hơn trong việc hiệu chuẩn các thông số thử nghiệm cho các kế hoạch thử nghiệm nhỏ.
CCT phải được thiết lập ở một điểm bắt đầu cụ thể để chạy một thuật toán cụ thể. Nếu bạn sử dụng bài kiểm tra tỷ lệ xác suất tuần tự làm tiêu chí dừng, thì tỷ lệ bắt đầu mặc định là 1,0; nếu bạn sử dụng phương pháp khoảng tin cậy, bạn cần chỉ định điểm bắt đầu. Thông thường, điểm bắt đầu là 0,0, biểu thị tâm phân phối; tuy nhiên, cũng có thể thiết lập điểm bắt đầu dựa trên dữ liệu lịch sử của ứng viên.
Trong CCT, việc lựa chọn câu hỏi rất linh hoạt. So với phương pháp truyền thống là sử dụng bộ câu hỏi cố định cho tất cả các ứng viên, các câu hỏi có thể được điều chỉnh liên tục theo hiệu suất của các ứng viên. Các phương pháp lựa chọn câu hỏi chủ yếu có thể được chia thành hai loại: lựa chọn dựa trên điểm chuẩn và lựa chọn dựa trên ước tính. Cách đầu tiên tối đa hóa thông tin được cung cấp xung quanh điểm chuẩn, trong khi cách thứ hai đưa ra lựa chọn dựa trên ước tính hiện tại về khả năng của thí sinh và hiệu quả của hai lựa chọn này sẽ khác nhau tùy thuộc vào tiêu chí dừng được sử dụng.
Tùy thuộc vào tiêu chí chấm điểm được sử dụng, việc lựa chọn câu hỏi kịp thời sẽ ảnh hưởng trực tiếp đến sự thành công của bài kiểm tra.
Có ba tiêu chí chấm dứt thường được sử dụng trong CCT: Lý thuyết quyết định Bayes, phương pháp khoảng tin cậy và kiểm định tỷ lệ xác suất chuỗi. Mỗi phương pháp đều có ưu và nhược điểm riêng, mang lại mức độ linh hoạt và độ chính xác khác nhau, nhưng cũng có thể mang lại một số tính chủ quan không cần thiết. Theo phương pháp khoảng tin cậy, ước tính hiện tại của người được kiểm tra về khả năng có tác động trực tiếp đến kết quả phân loại, trong khi bài kiểm tra tỷ lệ xác suất tuần tự thực hiện phân loại dưới dạng kiểm định giả thuyết.
Theo thời gian, CCT không chỉ thiết lập một tiêu chuẩn kiểm tra hiệu quả mà còn có tác động sâu sắc đến tương lai của lĩnh vực trắc nghiệm tâm lý. Khi các ứng dụng thực tế của nó tiếp tục mở rộng, nó sẽ ảnh hưởng như thế nào đến các phương pháp kiểm tra của chúng ta và sự hiểu biết của mọi người về đánh giá năng lực trong tương lai? Điều này đáng để mỗi chúng ta suy ngẫm.