In statistica esiste un metodo per risolvere problemi complessi con più variabili e il suo nome è "Minimi quadrati parziali" (PLS). Questa tecnologia è ampiamente utilizzata in campi come la chemiometria, la bioinformatica e persino le scienze sociali. Di fronte a dati complessi, PLS fornisce ai ricercatori potenti strumenti di analisi con il suo esclusivo metodo di proiezione dei dati.
Il nocciolo dei minimi quadrati parziali è trovare la potenziale relazione tra le variabili predittive e le variabili di risposta.
La considerazione principale della regressione PLS è come costruire in modo efficace un modello predittivo quando il numero di variabili indipendenti supera le osservazioni. Rispetto all’analisi di regressione tradizionale, il vantaggio di PLS è che può gestire efficacemente problemi di multicollinearità. Ciò fa sì che il PLS funzioni particolarmente bene in dati ad alta dimensione e in situazioni con multicollinearità.
PLS funziona proiettando i dati in un nuovo spazio in cui la covarianza tra la risposta e le variabili predittive è massimizzata. Il modello PLS cerca la più grande direzione multidimensionale nello spazio dei predittori che possa spiegare lo spazio delle variabili di risposta. Un tale processo fa sì che il PLS sia considerato un modello fattoriale bilineare
Grazie al metodo dei minimi quadrati parziali, i ricercatori possono vedere più chiaramente la struttura sottostante dei dati.
PLS non solo può eseguire la regressione quando la quantità di dati è enorme, ma è anche efficace per problemi di classificazione (come PLS-DA). Nei campi della biomedicina e della chimica, il PLS è ampiamente utilizzato per identificare le caratteristiche dei composti e classificarli.
La storia di questo metodo può essere fatta risalire allo statistico svedese Herman Wold e a suo figlio Svante Wold. Nelle sue prime applicazioni il PLS è stato utilizzato principalmente nel campo delle scienze sociali, mentre nel tempo il metodo è stato progressivamente introdotto in altri campi come le neuroscienze e l’antropologia.
Le varianti PLS come OPLS e L-PLS ampliano la profondità della sua applicazione e rendono il modello più interpretabile e predittivo.
Dopo una comprensione approfondita dell'architettura di base del PLS, i ricercatori di oggi hanno anche esplorato varie varianti di PLS, come OPLS (proiezione ortogonale alla struttura latente) e L-PLS (metodo dei minimi quadrati parziali con parametri a forma di L) . Queste varianti rendono il processo di analisi dei dati più raffinato e più adattabile a tipi e strutture di dati specifici.
La capacità di PLS di elaborare dati ad alta dimensione lo rende uno strumento innovativo in campi quali le previsioni dei mercati finanziari e la ricerca genetica. Sviluppi recenti combinano il PLS con la decomposizione di valore singolo (SVD), consentendo a questa tecnica di eseguire calcoli complessi ad alta dimensione su hardware di base.
Con il rapido sviluppo della scienza dei dati, la capacità di PLS non risiede solo nei modelli statistici che propone, ma anche nel potenziale dei dati nascosto dietro di esso. La funzione di analisi dei dati multidimensionale dimostrata dalla regressione PLS è uno dei capisaldi delle attuali applicazioni di intelligenza artificiale e deep learning.
Con l'avanzamento della tecnologia, l'applicazione del PLS creerà un circolo virtuoso, promuovendo ulteriormente l'integrazione trasversale in più campi?