Trong thống kê, kiểm định tỷ lệ khả năng là phương pháp kiểm định giả thuyết được sử dụng để so sánh mức độ phù hợp của hai mô hình thống kê cạnh tranh. Trong hai mô hình này, một là mô hình tối đa hóa toàn bộ không gian tham số, và mô hình còn lại là mô hình thu được sau một số hạn chế nhất định. Khi dữ liệu quan sát hỗ trợ mô hình hạn chế hơn (tức là giả thuyết không), hai khả năng xảy ra sẽ không khác nhau nhiều do lỗi lấy mẫu.
Vì vậy, mục đích của phép thử tỷ lệ khả năng là để kiểm tra xem tỷ lệ khả năng này có khác biệt đáng kể so với một hay nhiều tỷ lệ tương đương, xem logarit tự nhiên của nó có khác biệt đáng kể so với không hay không.
Kiểm định này, còn được gọi là kiểm định Wilks, là phương pháp kiểm định giả thuyết truyền thống sớm nhất trong ba phương pháp, hai phương pháp còn lại là kiểm định nhân Lagrange và kiểm định Wald. Hai điều này có thể được xem như là phép xấp xỉ của phép thử tỷ lệ khả năng và tương đương nhau về mặt tiệm cận. Trong các mô hình không có tham số chưa biết, việc sử dụng phép thử tỷ lệ khả năng có thể được chứng minh bằng cách sử dụng bổ đề Neyman–Pearson. Điều đáng nói là bổ đề cho thấy trong số tất cả các bài kiểm tra cạnh tranh, bài kiểm tra này có khả năng phát hiện cao nhất.
Giả sử chúng ta có một mô hình thống kê với không gian tham số Θ
. Giả thuyết không thường nêu rằng tham số θ
nằm trong một tập hợp con được chỉ định Θ0
, trong khi giả thuyết thay thế nêu rằng θ
nằm trong Θ0 Phần bù của
. Nghĩa là, giả thuyết thay thế cho rằng θ
thuộc về Θ \ Θ0
. Nếu giả thuyết không là đúng, công thức tính toán cho thống kê kiểm định tỷ lệ khả năng là:
λLR = −2 ln [
supθ∈Θ0 L(θ)
/supθ∈Θ L(θ)
]
Ở đây sup
có nghĩa là tối cao. Vì mọi khả năng đều dương nên tỷ lệ khả năng có giá trị từ 0 đến 1 vì giá trị cực đại bị ràng buộc không thể vượt quá giá trị cực đại không bị ràng buộc. Thống kê kiểm định tỷ lệ khả năng thường được biểu thị dưới dạng chênh lệch logarit-khả năng:
λLR = −2 [
ℓ(θ0)
−ℓ(θ^)
]
Ở đây, chìa khóa của bài kiểm tra tỷ lệ khả năng là bài kiểm tra lẫn nhau giữa các mô hình khác nhau. Nếu các mô hình được lồng vào nhau (tức là mô hình phức tạp hơn có thể được chuyển đổi thành mô hình đơn giản hơn bằng cách áp đặt các hạn chế cho các tham số của nó), thì nhiều số liệu thống kê kiểm tra phổ biến có thể được xem như các kiểm tra tỷ lệ log-likelihood tương tự. Bao gồm các bài kiểm tra Z, bài kiểm tra F, bài kiểm tra G và bài kiểm tra chi bình phương của Pearson, cùng một số bài kiểm tra khác.
Trong thử nghiệm giả thuyết đơn giản so với đơn giản, phân phối dữ liệu được xác định đầy đủ theo cả giả thuyết không và giả thuyết thay thế. Do đó, có thể sử dụng một biến thể của bài kiểm tra tỷ lệ khả năng, ví dụ:
Λ(x) =
L(θ0 | x)
/L(θ1 | x)
Nếu Λ > c
, thì không bác bỏ giả thuyết vô hiệu H0
; nếu Λ < c
, thì bác bỏ giả thuyết vô hiệu H0< /mã>. Trong trường hợp này, bổ đề Neyman-Pearson cho thấy thêm rằng bài kiểm tra tỷ lệ khả năng này là bài kiểm tra mạnh nhất trong tất cả các bài kiểm tra mức độ alpha.
Tỷ lệ khả năng là một hàm của dữ liệu và là chỉ báo về hiệu suất của một mô hình so với mô hình khác. Nếu giá trị của tỷ lệ khả năng nhỏ, điều đó có nghĩa là xác suất của kết quả quan sát được theo giả thuyết không thấp hơn nhiều so với giả thuyết thay thế, do đó bác bỏ giả thuyết không. Ngược lại, tỷ lệ khả năng cao chỉ ra rằng kết quả quan sát được có khả năng xảy ra gần như ngang bằng với giả thuyết không so với giả thuyết thay thế, do đó giả thuyết không không thể bị bác bỏ.
Giả sử chúng ta có n mẫu từ một phân phối chuẩn. Chúng tôi muốn kiểm tra xem giá trị trung bình μ của quần thể có phải là giá trị μ0
nhất định hay không. Lúc này, giả thuyết không có thể được biểu thị là H0: μ = μ0
, và giả thuyết thay thế là H1: μ ≠ μ0
. Sau khi tính toán tương ứng, có thể thu được biểu thức của tỷ lệ khả năng:
λLR = nln [ 1 +
t^2 / (n - 1)
]
Sau đó, phân phối cụ thể được sử dụng để hướng dẫn các suy luận tiếp theo.
Mặc dù phân phối chính xác của tỷ lệ khả năng rất khó xác định trong nhiều trường hợp, định lý Wilkes nêu rằng nếu giả thuyết không là đúng và quy mô mẫu n
có xu hướng vô cực, thì Thống kê kiểm định sẽ tuân theo phân phối chi bình phương một cách tiệm cận. Điều này cho phép chúng ta tính toán tỷ lệ khả năng và so sánh nó với mức ý nghĩa mong muốn.
Liệu có thể cải thiện hơn nữa quá trình lựa chọn giữa các mô hình thống kê thông qua các phương pháp khác không?