En las estadísticas modernas, el concepto de modelos lineales permite a los investigadores comprender y predecir las relaciones entre variables. Entre ellos, el Modelo Lineal General (GLM) es ampliamente utilizado en el análisis de regresión multivariante, mientras que la Regresión Lineal Múltiple es un caso especial de esta teoría. Entonces, ¿cuál es la conexión entre ambos?
El modelo lineal general es una forma parsimoniosa de representar múltiples modelos de regresión multivariante simultáneamente, lo que significa que no es un modelo lineal estadístico independiente. En resumen, podemos escribir diferentes modelos de regresión multivariante en la siguiente forma:
Y = X * B + U
Aquí, Y es una matriz que contiene los datos de múltiples variables medidas, X es la matriz de observación de las variables independientes, B es la matriz de parámetros y U es la matriz de incertidumbre o error. Vale la pena mencionar que generalmente se supone que estos errores no están correlacionados entre observaciones y siguen una distribución normal multivariada. Si estos errores no siguen una distribución normal multivariada, podemos utilizar un modelo lineal generalizado (GLM) para relajar los supuestos sobre Y y U.
El significado central del modelo lineal general es que combina una variedad de modelos estadísticos diferentes, como ANOVA, ANCOVA, MANOVA, MANCOVA, etc., lo que le permite manejar más de una variable dependiente y proporcionar un análisis más completo. En este sentido, la regresión lineal ordinaria es un caso especial del modelo lineal general, es decir, está limitada al caso de una variable dependiente.
La regresión lineal ordinaria es un modelo relacionado con la regresión lineal simple que se centra en los efectos de múltiples variables independientes sobre una sola variable dependiente.
Específicamente, el modelo básico de la regresión lineal ordinaria es: Yi = β0 + β1 * Xi1 + β2 * Xi2 + ... + βp * Xip + εi. Si consideramos n observaciones y p variables independientes utilizando esta fórmula, Yi es la i-ésima observación de la variable dependiente, mientras que Xik representa la observación correspondiente de la variable independiente, βj es el parámetro a estimar y εi es el i-ésimo error normal independiente e idénticamente distribuido.
Para el modelo lineal general, cuando hay más de una variable dependiente, entramos en el ámbito de la regresión multivariada. En este caso, para cada variable dependiente se estiman los parámetros de regresión correspondientes, por lo que computacionalmente se trata en realidad de una serie de regresiones lineales múltiples estándar, todas utilizando las mismas variables explicativas.
Mirando más allá, una diferencia importante entre los modelos lineales generales y los modelos lineales generalizados (GLM) es que los GLM permiten un rango más amplio de distribuciones residuales, eligiendo entre la familia exponencial de distribuciones, como la regresión logística binaria, la regresión de Poisson, etc. La importancia de esta crítica es que cuando se enfrentan a diferentes tipos de variables de resultado, los investigadores pueden elegir el modelo apropiado para obtener el mejor efecto de predicción.El modelo lineal general supone que los residuos seguirán una distribución normal condicional, mientras que el modelo lineal generalizado relaja este supuesto para permitir una variedad de otras distribuciones.
Por ejemplo, se puede ver la aplicación de modelos lineales generales en el análisis de datos de exploraciones cerebrales, donde Y podría consistir en los datos de las exploraciones cerebrales y X serían las variables en el diseño experimental. Estas pruebas se realizan generalmente de forma univariante, lo que en este contexto se denomina análisis univariante de masas, y se utilizan a menudo en estudios de mapeo paramétrico estadístico.
En resumen, la regresión lineal ordinaria se relaciona con el modelo lineal general como familia y sus casos especiales, centrándose en cómo pasar de observaciones simples a relaciones multivariadas complejas. A medida que avanzan las técnicas de análisis estadístico, comprender los tesoros ocultos en estos modelos será una parte integral del trabajo de investigación. Sin embargo, en esta tendencia de desarrollo, tal vez deberíamos preguntarnos: ¿Ha utilizado plenamente estas herramientas estadísticas para influir en sus investigaciones y toma de decisiones?