Trong nghiên cứu học thuật và đánh giá máy học, việc đo lường tính nhất quán giữa người đánh giá hoặc phân loại ngày càng được coi trọng và hệ số kappa của Cohen là một công cụ thống kê quan trọng không chỉ có thể Đánh giá tính nhất quán giữa các bài đánh giá mà còn có thể tiết lộ những sự hợp tác ẩn. Việc tính toán và diễn giải số liệu thống kê này có những thách thức riêng và việc sử dụng đúng hệ số Kappa có thể thúc đẩy quá trình ra quyết định công bằng và chính đáng hơn.
Hệ số Kappa của Cohen được coi là công cụ đo lường mạnh mẽ hơn so với phép tính phần trăm đồng thuận đơn giản.
Hệ số Kappa của Cohen được đề cập sớm nhất vào năm 1892, khi nhà thống kê Galton lần đầu tiên khám phá những số liệu thống kê tương tự. Năm 1960, Jacob Cohen đã công bố một bài báo mang tính đột phá trên tạp chí Đo lường Giáo dục và Tâm lý, chính thức giới thiệu hệ số Kappa như một kỹ thuật mới, tạo nền tảng quan trọng cho các nghiên cứu sau này.
Hệ số Kappa của Cohen chủ yếu được sử dụng để đo lường sự đồng thuận giữa hai người đánh giá khi họ phân loại cùng một mục. Nó tính đến khả năng đồng thuận ngẫu nhiên giữa những người đánh giá và thường được thể hiện như sau:
Trong đó po là sự đồng thuận được quan sát giữa những người đánh giá và pe là xác suất dự đoán của sự đồng thuận ngẫu nhiên. Giá trị của κ là 1 khi hai người đánh giá hoàn toàn đồng ý và là 0 khi không có sự đồng ý nào ngoài sự đồng ý ngẫu nhiên giữa những người đánh giá. Trong một số trường hợp, giá trị này thậm chí có thể là số âm, cho thấy sự không nhất quán đáng kể giữa các đánh giá.
Giả sử khi xem xét 50 đơn xin tài trợ, hai người đánh giá sẽ đưa ra đánh giá “ủng hộ” hoặc “không ủng hộ” cho mỗi đơn. Nếu 20 ứng dụng được cả người đánh giá A và người đánh giá B hỗ trợ và 15 ứng dụng không được người đánh giá A hỗ trợ thì mức độ đồng thuận quan sát được po của chúng có thể được tính là 0,7.
Điều đáng chú ý là hệ số Kappa của Cohen có thể giải quyết vấn đề về tính nhất quán ngẫu nhiên không thể phản ánh chỉ bằng cách sử dụng phần trăm.
Tính toán thêm độ nhất quán mong đợi pe. Dựa trên dữ liệu lịch sử của từng người đánh giá, người đánh giá A ủng hộ 50% ý kiến, trong khi người đánh giá B ủng hộ 60%. Do đó, dự đoán đồng thuận ngẫu nhiên của cả hai bên là:
Cuối cùng, áp dụng công thức trên để tính giá trị Kappa, ta được κ = 0,4, điều này có nghĩa là có mức độ đồng thuận vừa phải giữa hai người đánh giá.
Hệ số Kappa của Cohen được sử dụng rộng rãi trong nhiều lĩnh vực, từ y học, tâm lý học đến khoa học xã hội, đặc biệt là khi cần phân tích dữ liệu định tính. Nó có thể giúp các nhà nghiên cứu xác định những thành kiến và mâu thuẫn tiềm ẩn trong quá trình đánh giá, do đó nâng cao độ tin cậy của kết quả nghiên cứu.
Phần kết luậnTuy nhiên, các nhà nghiên cứu cần thận trọng khi diễn giải kết quả của hệ số Kappa, vì giá trị của nó có thể liên quan đến nhiều yếu tố như phương pháp phân loại của bài đánh giá, quy mô và phân phối mẫu, v.v.
Hệ số Kappa của Cohen không chỉ là một công cụ thống kê hữu ích mà còn là một chỉ số quan trọng để phát hiện sự hợp tác tiềm ẩn giữa những người đánh giá. Tuy nhiên, làm thế nào để sử dụng và diễn giải đúng chỉ số này vẫn là một câu hỏi đòi hỏi phải suy nghĩ sâu sắc. Bạn đã bao giờ nghĩ về những thách thức mà bạn có thể gặp phải trong nghiên cứu của mình chưa?