Em estatística, existe um método para resolver problemas multivariados complexos chamado Mínimos Quadrados Parciais (PLS). Essa tecnologia é amplamente utilizada em áreas como quimiometria, bioinformática e até ciências sociais. Quando confrontados com dados desafiadores, o PLS fornece aos pesquisadores uma ferramenta analítica poderosa com seu método exclusivo de projeção de dados.
O cerne do método dos mínimos quadrados parciais é encontrar a relação potencial entre variáveis preditoras e variáveis de resposta.
A principal consideração da regressão PLS é como construir efetivamente um modelo de previsão quando o número de variáveis independentes excede o número de observações. Comparado com a análise de regressão tradicional, a vantagem do PLS é que ele pode lidar efetivamente com o problema da multicolinearidade. Isso torna o PLS particularmente bom em desempenho em dados de alta dimensão e em situações com multicolinearidade.
O PLS funciona projetando os dados em um novo espaço onde a covariância entre a variável de resposta e as variáveis preditoras é maximizada. O modelo PLS busca a direção multidimensional no espaço da variável preditora que pode explicar o espaço da variável de resposta na maior extensão possível. Esse processo torna o PLS um modelo de fator bilinear.
Por meio de mínimos quadrados parciais, os pesquisadores podem ver mais claramente a estrutura subjacente dos dados.
O PLS não só é capaz de realizar regressão quando a quantidade de dados é grande, como também é eficaz para problemas de classificação (como o PLS-DA). Nas áreas de biomedicina e química, o PLS é amplamente utilizado para identificar características de compostos e sua classificação.
A história dessa abordagem pode ser rastreada até os estatísticos suecos Herman Wold e seu filho Svante Wold. Em suas aplicações iniciais, o PLS era usado principalmente nas ciências sociais, mas com o tempo o método foi gradualmente introduzido em outros campos, como neurociência e antropologia.
Variantes do PLS, como OPLS e L-PLS, ampliam a profundidade de sua aplicação e tornam o modelo mais interpretável e preditivo.
Após obter uma compreensão mais profunda da arquitetura básica do PLS, os pesquisadores hoje também exploraram uma variedade de variantes do PLS, como OPLS (Projeção Ortogonal para Estrutura Latente) e L-PLS (Mínimos Quadrados Parciais com Formato de L). Parâmetros). Essas variantes tornam o processo de análise de dados mais refinado e mais adaptável a tipos e estruturas de dados específicos.
A capacidade do PLS de processar dados de alta dimensão o torna uma ferramenta inovadora em áreas como previsão do mercado financeiro e pesquisa genética. Desenvolvimentos recentes combinaram PLS com decomposição de valor único (SVD), tornando essa técnica capaz de executar cálculos complexos de alta dimensão em hardware comum.
Com o rápido desenvolvimento da ciência de dados, o poder do PLS não está apenas no modelo estatístico que ele propõe, mas também no potencial de dados oculto por trás dele. A função de análise de dados multidimensionais demonstrada pela regressão PLS é um dos pilares das atuais aplicações de inteligência artificial e aprendizado profundo.
Com o avanço da tecnologia, a aplicação do PLS formará um círculo virtuoso e promoverá ainda mais a integração cruzada de vários campos?