통계학에서 우도비 검정은 두 개의 경쟁 통계 모델의 적합도를 비교하는 데 사용되는 가설 검정 방법입니다. 두 모델 중 하나는 전체 매개변수 공간의 최대화 모델이고, 다른 하나는 특정 제약 조건을 충족한 후 얻은 모델입니다. 관찰된 데이터가 더 제한적인 모델(즉, 귀무 가설)을 뒷받침하는 경우, 표집 오차로 인해 두 가지 가능성이 크게 다르지 않아야 합니다.
따라서, 우도비 검정의 목적은 이 우도비가 1과 유의하게 다른지, 또는 그 자연대수가 0과 유의하게 다른지 여부를 검정하는 것입니다.
윌크스 검정이라고도 알려진 이 검정은 세 가지 전통적인 가설 검정 방법 중 가장 초기의 방법입니다. 다른 두 가지는 라그랑주 승수 검정과 월드 검정입니다. 둘은 우도비 검정의 근사치로 볼 수 있으며 점근적으로 동등합니다. 알려지지 않은 매개변수가 없는 모델에서는 Neyman-Pearson 보조정리를 사용하여 우도비 검정을 사용하는 것이 정당화될 수 있습니다. 이 보조정리는 모든 경쟁 테스트 중에서 이 테스트가 가장 높은 탐지력을 가지고 있음을 보여준다는 점을 언급할 가치가 있습니다.
매개변수 공간 Θ
를 갖는 통계적 모델이 있다고 가정해 보겠습니다. 귀무가설은 일반적으로 매개변수 θ
가 지정된 부분 집합 Θ0
에 있다고 명시하는 반면, 대립가설은 θ
가 Θ0
에 있다고 명시합니다. 의 보수. 즉, 대안 가설은 θ
가 Θ \ Θ0
에 속한다는 것입니다. 귀무 가설이 참이면, 우도비 검정 통계량 계산 공식은 다음과 같습니다.
λLR = −2 ln [
supθ∈Θ0 L(θ)
/supθ∈Θ L(θ)
]
여기서 sup
는 최고를 뜻합니다. 모든 우도가 양수이므로 우도 비율은 0과 1 사이의 값을 가지는데, 제한된 최대값은 제약되지 않은 최대값을 초과할 수 없기 때문입니다. 우도비 검정 통계량은 종종 로그 우도 차이로 표현됩니다.
λLR = −2 [
ℓ(θ0)
−ℓ(θ^)
]
여기서, 우도비 검정의 핵심은 서로 다른 모델 간의 상호 검정입니다. 모델이 중첩된 경우(즉, 매개변수에 제한을 가함으로써 더 복잡한 모델을 더 간단한 모델로 변환할 수 있는 경우), 많은 공통적인 검정 통계량을 유사한 로그-우도비 검정으로 볼 수 있습니다. 여기에는 Z 검정, F 검정, G 검정, 피어슨 카이 제곱 검정 등이 포함됩니다.
단순 가설 검정에서는 귀무 가설과 대립 가설 모두에서 데이터 분포가 완전히 지정됩니다. 따라서 다음과 같이 우도비 검정의 변형을 사용할 수 있습니다.
Λ(x) =
L(θ0 | x)
/L(θ1 | x)
Λ > c
이면 귀무 가설 H0
을 기각하지 않습니다. Λ < c
이면 귀무 가설 을 기각합니다. >H0< /코드>. 이 경우, 네이만-피어슨 보조정리는 이 우도비 검정이 모든 알파 수준 검정 중에서 가장 강력하다는 것을 더욱 잘 보여줍니다.
가능도 비는 데이터의 함수이며, 한 모델의 성능을 다른 모델과 비교한 지표입니다. 가능도 비의 값이 작으면 귀무 가설에 따른 관찰 결과의 확률이 대립 가설에 따른 확률보다 훨씬 낮다는 것을 의미하므로 귀무 가설은 기각됩니다. 반대로, 높은 우도비는 관찰된 결과가 귀무 가설과 대립 가설에서 모두 일어날 가능성이 거의 같다는 것을 나타내므로, 귀무 가설을 기각할 수 없습니다.
정규분포에서 n개의 샘플이 있다고 가정해보자. 우리는 모집단의 평균 μ가 주어진 값 μ0
인지 검정하고 싶습니다. 이때, 귀무가설은 H0: μ = μ0
로 표현될 수 있고, 대립가설은 H1: μ ≠ μ0
입니다. 해당 계산을 마치면 우도비의 식을 얻을 수 있습니다.
λLR = n ln [ 1 +
t^2 / (n - 1)
]
그런 다음, 특정 분포를 사용하여 후속 추론을 진행합니다.
많은 경우 우도비의 정확한 분포를 결정하기 어렵지만 Wilkes의 정리에 따르면 귀무가설이 사실이고 표본 크기 n
이 무한대로 수렴하는 경우 검정 통계량은 다음과 같습니다. 점근적으로 카이제곱 분포를 따릅니다. 이를 통해 우도비를 계산하고 이를 원하는 유의수준과 비교할 수 있습니다.
다른 방법을 통해 통계적 모델을 선택하는 과정을 더욱 개선할 수 있을까요?