Em estatística, o teste da razão de verossimilhança é um método de teste de hipóteses usado para comparar a qualidade do ajuste de dois modelos estatísticos concorrentes. Destes dois modelos, um é um modelo de maximização de todo o espaço de parâmetros, e o outro é um modelo obtido após certas restrições. Quando os dados observados apoiam o modelo mais restrito (ou seja, a hipótese nula), as duas probabilidades não devem diferir muito devido ao erro de amostragem.
Assim, o objetivo do teste da razão de verossimilhança é testar se essa razão de verossimilhança é significativamente diferente de um ou, mais equivalentemente, se seu logaritmo natural é significativamente diferente de zero.
Este teste, também conhecido como teste de Wilks, é o mais antigo dos três métodos tradicionais de teste de hipóteses, sendo os outros dois o teste do multiplicador de Lagrange e o teste de Wald. Os dois podem ser vistos como aproximações do teste da razão de verossimilhança e são assintoticamente equivalentes. Em modelos sem parâmetros desconhecidos, o uso do teste da razão de verossimilhança pode ser justificado usando o lema de Neyman-Pearson. Vale ressaltar que o lema mostra que, entre todos os testes concorrentes, este teste tem o maior poder de detecção.
Suponha que temos um modelo estatístico com espaço de parâmetros Θ
. A hipótese nula geralmente afirma que o parâmetro θ
está em um subconjunto especificado Θ0
, enquanto a hipótese alternativa afirma que θ
está em Θ0 complemento de
. Ou seja, a hipótese alternativa sustenta que θ
pertence a Θ \ Θ0
. Se a hipótese nula for verdadeira, a fórmula de cálculo para a estatística do teste da razão de verossimilhança é:
λLR = −2 ln [
supθ∈Θ0 L(θ)
/supθ∈Θ L(θ)
]
Aqui sup
significa supremo. Como todas as probabilidades são positivas, as razões de verossimilhança têm valores entre zero e um, já que o máximo restrito não pode exceder o máximo irrestrito. A estatística do teste da razão de verossimilhança é frequentemente expressa como a diferença de logaritmo da verossimilhança:
λLR = −2 [
ℓ(θ0)
−ℓ(θ^)
]
Aqui, a chave para o teste da razão de verossimilhança é o teste mútuo entre diferentes modelos. Se os modelos forem aninhados (ou seja, o modelo mais complexo pode ser transformado em um mais simples impondo restrições em seus parâmetros), muitas estatísticas de teste comuns podem ser vistas como testes de razão de logaritmo de verossimilhança análogos. Isso inclui o teste Z, o teste F, o teste G e o teste qui-quadrado de Pearson, entre outros.
No teste de hipóteses simples versus simples, a distribuição dos dados é totalmente especificada tanto nas hipóteses nula quanto nas alternativas. Portanto, uma variação do teste da razão de verossimilhança pode ser usada, por exemplo:
Λ(x) =
L(θ0 | x)
/L(θ1 | x)
Se Λ > c
, então não rejeite a hipótese nula H0
; se Λ < c
, então rejeite a hipótese nula H0< /código>. Neste caso, o lema de Neyman-Pearson mostra ainda que este teste de razão de verossimilhança é o mais poderoso de todos os testes de nível alfa.
A razão de verossimilhança é uma função dos dados e é um indicador do desempenho de um modelo em relação a outro. Se o valor da razão de verossimilhança for pequeno, significa que a probabilidade do resultado observado sob a hipótese nula é muito menor do que sob a hipótese alternativa, rejeitando assim a hipótese nula. Por outro lado, uma alta razão de verossimilhança indica que o resultado observado é quase tão provável sob a hipótese nula quanto sob a hipótese alternativa, portanto a hipótese nula não pode ser rejeitada.
Suponha que temos n amostras de uma distribuição normal. Queremos testar se a média μ da população é um determinado valor μ0
. Neste momento, a hipótese nula pode ser expressa como H0: μ = μ0
, e a hipótese alternativa é H1: μ ≠ μ0
. Após os cálculos correspondentes, pode-se obter a expressão da razão de verossimilhança:
λLR = n ln [ 1 +
t^2 / (n - 1)
]
Então, a distribuição específica é usada para orientar inferências subsequentes.
Embora a distribuição exata da razão de verossimilhança seja difícil de determinar em muitos casos, o teorema de Wilkes afirma que se a hipótese nula for verdadeira e o tamanho da amostra n
tender ao infinito, então a estatística de teste será seguem assintoticamente uma distribuição qui-quadrado. Isso nos permite calcular a razão de verossimilhança e compará-la ao nível de significância desejado.
É possível melhorar ainda mais o processo de escolha entre modelos estatísticos por meio de outros métodos?