No campo da econometria, o modelo de regressão aparentemente não relacionado (SUR) foi proposto por Arnold Zellner em 1962 como uma extensão do modelo de regressão linear. O modelo contém múltiplas equações de regressão, cada uma com sua própria variável dependente independente e possivelmente diferentes variáveis explicativas exógenas. Embora o desenho dessas equações pareça não ter relação entre si, na verdade seus termos de erro estão correlacionados entre si, o que tem despertado grande interesse entre os econometristas.
De acordo com as suposições do modelo SUR, os termos de erro são independentes entre observações, mas os termos de erro dentro da mesma observação podem ser correlacionados entre equações.
De acordo com a teoria de Zerná, cada equação no modelo SUR pode ser estimada independentemente, geralmente usando o método dos mínimos quadrados ordinários (MQO). Entretanto, essa abordagem geralmente não é tão eficiente quanto o método SUR, que usa uma matriz de variância-covariância específica e mínimos quadrados generalizados viáveis (FGLS) para estimativa.
Na maioria dos casos, o método SUR pode efetivamente melhorar a precisão da estimativa, especialmente quando há correlação entre os termos de erro. Isso permite que o modelo SUR reflita melhor situações do mundo real, porque em muitos problemas econômicos, as variáveis influenciam umas às outras e essa relação de influência geralmente surge ao longo do tempo.
Quando a matriz de covariância dos termos de erro é uma matriz diagonal conhecida, os resultados da estimativa SUR são os mesmos que os da estimativa MCO equação por equação.
Isso significa que, em certos casos específicos, uma regressão separada usando OLS pode dar os mesmos resultados que SUR. Por exemplo, quando as variáveis explicativas de cada equação são exatamente as mesmas, a estimativa do modelo SUR e os resultados do MCO serão altamente consistentes.
Além disso, a aplicação dos modelos SUR não se limita a apenas algumas equações, mas também se estende a sistemas mais complexos, como modelos de equações simultâneas. Nesses casos, as variáveis explicativas do lado direito da equação também podem ser variáveis endógenas, o que motivou o desenvolvimento de técnicas econométricas.
Os modelos SUR são geralmente estimados usando o método dos mínimos quadrados generalizados viáveis (FGLS), que é uma abordagem em duas etapas. Primeiro, realizamos a regressão usando mínimos quadrados ordinários, e os resíduos obtidos são usados para estimar os elementos da matriz de covariância. Na segunda etapa, usamos a matriz de variância para realizar estimativas de mínimos quadrados generalizados, o que pode efetivamente melhorar a precisão da estimativa.
Além do método FGLS, há várias outras técnicas de estimativa disponíveis, incluindo estimativa de máxima verossimilhança (ML), bem como mínimos quadrados generalizados iterativos (IGLS) e mínimos quadrados ordinários iterativos (IOLS). Cada um desses métodos tem suas próprias vantagens e desvantagens, mas estudos mostram que eles tendem a produzir resultados numericamente equivalentes, permitindo que os pesquisadores escolham a técnica apropriada com base em suas necessidades reais.
Com o desenvolvimento da econometria, o modelo SUR está sendo incorporado cada vez mais em softwares estatísticos. Por exemplo, na linguagem R, o pacote “systemfit” pode ser usado para estimar o modelo SUR; no Stata, os comandos “sureg” e “suest” podem ser usados para completar a estimativa correspondente.
O desenvolvimento desta série de tecnologias enriqueceu muito o conjunto de ferramentas econométricas, permitindo que pesquisadores forneçam análises e previsões mais precisas quando confrontados com problemas econômicos complexos.
Em resumo, o poder do modelo SUR está na sua capacidade de considerar completamente as possíveis interações entre diferentes equações de regressão, o que nos dá uma vantagem ao lidar com problemas multivariados. No entanto, isso significa que usar o SUR é a melhor opção em todos os casos?