Trong nghiên cứu khoa học và phân tích thống kê, giá trị p là một khái niệm thống kê quan trọng nhưng nó thường khiến mọi người nhầm lẫn. Giá trị p được phản ánh trong các thử nghiệm dương tính giả, đặc biệt là khi chúng tôi thực hiện kiểm tra giả thuyết vô hiệu và thể hiện khả năng dữ liệu được quan sát ít nhất là cực đoan nếu giả thuyết vô hiệu là đúng. Tuy nhiên, sự hiểu lầm và sử dụng sai giá trị p là điều thường gặp trong toán học và các ngành khoa học liên quan. Do đó, chúng ta cần nghiên cứu sâu hơn về ý nghĩa thực sự của giá trị p và ứng dụng của nó.
Mặc dù việc báo cáo giá trị p cho các bài kiểm tra thống kê là thông lệ trong nhiều ấn phẩm học thuật, nhưng việc hiểu sai và sử dụng giá trị p không chính xác đã trở thành một chủ đề chính.
Trong thống kê, mọi phỏng đoán về phân bố xác suất chưa biết của dữ liệu quan sát được gọi là giả thuyết thống kê. Nếu chúng ta chỉ nêu một giả thuyết và mục đích của kiểm tra thống kê là để xem giả thuyết đó có hợp lý hay không thì loại kiểm tra này được gọi là kiểm tra giả thuyết khống. Giả thuyết không có nghĩa là thuộc tính của giả thuyết không tồn tại. Thông thường, giả thuyết không giả định rằng một số tham số, chẳng hạn như mối tương quan hoặc chênh lệch trung bình, bằng không. Khi thực hiện kiểm tra, chúng tôi tính toán một thống kê bằng số và sử dụng nó để suy ra liệu dữ liệu được quan sát có ý nghĩa thống kê hay không.
Theo định nghĩa, giá trị p là xác suất đạt được thống kê phát hiện ít nhất cũng cực đoan bằng kết quả quan sát được nếu giả thuyết khống là đúng. Do đó, giá trị p càng nhỏ thì chúng ta càng có thể nghi ngờ tính đúng đắn của giả thuyết không. Tuy nhiên, điều này không có nghĩa là giả thuyết khống là sai.
Hiệp hội Thống kê Hoa Kỳ tuyên bố: "Giá trị p không đo lường khả năng giả thuyết nghiên cứu là đúng cũng như không đo lường khả năng dữ liệu được tạo ngẫu nhiên."
Giá trị p được sử dụng rộng rãi trong việc kiểm tra giả thuyết thống kê. Trước khi tiến hành nghiên cứu, nhà nghiên cứu chọn một mô hình (giả thuyết không) và mức ý nghĩa α (phổ biến nhất là 0,05). Nếu giá trị p nhỏ hơn α, điều đó có nghĩa là dữ liệu được quan sát đủ mâu thuẫn với giả thuyết không để chúng ta có thể bác bỏ giả thuyết đó. Tuy nhiên, nhiều nhà thống kê đã nêu vấn đề sử dụng sai và giải thích sai giá trị p, chẳng hạn như coi bất kỳ giá trị p nào nhỏ hơn 0,05 là hỗ trợ cho giả thuyết thay thế.
Các nhà thống kê khác khuyên bạn nên bỏ giá trị p và tập trung nhiều hơn vào các phương pháp thống kê suy luận khác, chẳng hạn như khoảng tin cậy, tỷ lệ khả năng hoặc hệ số Bayes.
Thông thường, việc tính giá trị p yêu cầu xác định thống kê kiểm tra, kiểm tra một phía hoặc hai phía mà nhà nghiên cứu đã chọn thực hiện và dữ liệu. Nếu giả thuyết khống là đúng thì các giá trị p phải được phân bổ đều từ 0 đến 1, điều đó có nghĩa là khi bạn lặp lại cùng một thử nghiệm, bạn thường sẽ nhận được các giá trị p khác nhau, ngay cả khi giả thuyết khống là đúng.
Giả sử bạn tiến hành một thử nghiệm để kiểm tra xem một đồng xu có công bằng hay không. Kết quả cho thấy trong 20 lần tung đồng xu thì có 14 lần mặt ngửa. Trong trường hợp này, giả thuyết không là đồng tiền này công bằng. Nếu chúng ta thực hiện kiểm tra mặt ngửa, nghĩa là tập trung vào việc xác nhận xem đồng xu có thiên về mặt ngửa hay không, thì giá trị p là xác suất xuất hiện ít nhất 14 mặt ngửa nếu đồng xu là hợp lý.
Tóm lại, giá trị p chắc chắn là một phần không thể thiếu của thống kê, nhưng chúng ta phải cẩn thận khi sử dụng chúng như một công cụ để đánh giá các giả thuyết nghiên cứu. Việc xem xét cẩn thận bối cảnh của giá trị p và thiết kế nghiên cứu tương ứng là một bước cần thiết. Bạn đã hiểu sâu hơn về con số này chưa?