En estadística, existe un método para resolver problemas multivariados complejos llamado Mínimos Cuadrados Parciales (PLS). Esta tecnología es ampliamente utilizada en campos como la quimiometría, la bioinformática e incluso las ciencias sociales. Cuando se enfrentan a datos desafiantes, PLS proporciona a los investigadores una poderosa herramienta analítica con su método único de proyección de datos.
El núcleo del método de mínimos cuadrados parciales es encontrar la relación potencial entre las variables predictoras y las variables de respuesta.
La consideración principal de la regresión PLS es cómo construir eficazmente un modelo de predicción cuando el número de variables independientes excede el número de observaciones. En comparación con el análisis de regresión tradicional, la ventaja de PLS es que puede abordar eficazmente el problema de la multicolinealidad. Esto hace que PLS sea particularmente bueno en su desempeño con datos de alta dimensión y en situaciones con multicolinealidad.
PLS funciona proyectando los datos en un nuevo espacio donde se maximiza la covarianza entre la variable de respuesta y las variables predictoras. El modelo PLS busca la dirección multidimensional en el espacio de la variable predictora que pueda explicar el espacio de la variable de respuesta en la mayor medida. Este proceso convierte a PLS en un modelo factorial bilineal.
A través de mínimos cuadrados parciales, los investigadores pueden ver más claramente la estructura subyacente de los datos.
PLS no solo es capaz de realizar regresiones cuando la cantidad de datos es enorme, también es eficaz para problemas de clasificación (como PLS-DA). En los campos de la biomedicina y la química, PLS se utiliza ampliamente para identificar características de compuestos y su clasificación.
La historia de este enfoque se remonta a los estadísticos suecos Herman Wold y su hijo Svante Wold. En sus aplicaciones iniciales, PLS se utilizó principalmente en las ciencias sociales, pero con el tiempo el método se introdujo gradualmente en otros campos como la neurociencia y la antropología.
Las variantes de PLS como OPLS y L-PLS amplían la profundidad de su aplicación y hacen que el modelo sea más interpretable y predictivo.
Después de obtener una comprensión más profunda de la arquitectura básica de PLS, los investigadores hoy también han explorado una variedad de variantes de PLS, como OPLS (Proyección Ortogonal a Estructura Latente) y L-PLS (Mínimos Cuadrados Parciales con Forma de L). Parámetros). Estas variantes hacen que el proceso de análisis de datos sea más refinado y más adaptable a tipos y estructuras de datos específicos.
La capacidad de PLS para procesar datos de alta dimensión lo convierte en una herramienta innovadora en campos como la previsión de los mercados financieros y la investigación genética. Los desarrollos recientes han combinado PLS con la descomposición de valor único (SVD), lo que hace que esta técnica sea capaz de realizar cálculos complejos de alta dimensión en hardware básico.Con el rápido desarrollo de la ciencia de datos, el poder de PLS no radica sólo en el modelo estadístico que propone, sino también en el potencial de datos que se esconde detrás de él. La función de análisis de datos multidimensionales demostrada por la regresión PLS es una de las piedras angulares de las aplicaciones actuales de inteligencia artificial y aprendizaje profundo.
Con el avance de la tecnología, ¿la aplicación de PLS formará un círculo virtuoso y promoverá aún más la integración cruzada de múltiples campos?