Nel campo della ricerca sul cancro, l'eterogeneità dei campioni tumorali pone numerose sfide all'analisi dei dati. Con il rapido sviluppo della genomica, i ricercatori hanno iniziato ad adottare nuovi metodi statistici per acquisire una comprensione più approfondita della composizione dei campioni tumorali e migliorare l'accuratezza delle previsioni. Tra questi è nato il metodo statistico DeMix, che è diventato uno strumento importante per la deconvoluzione del trascrittoma del cancro.
DeMix è un metodo statistico che prevede il probabile rapporto tra cellule tumorali e cellule stromali in un campione e utilizza un modello misto lineare per contrastare l'eterogeneità dei dati nei campioni tumorali.
I campioni di tumori solidi derivano spesso dalla pratica clinica e sono composti da più popolazioni di cellule tumorali clonali, nonché da tessuto normale adiacente, stroma e cellule immunitarie infiltranti. Questa struttura complessa rende molte analisi dei dati genomici difficili e piene di distorsioni. Pertanto, prima dell'analisi, è estremamente importante stimare con precisione la purezza del tumore, ovvero la percentuale di cellule tumorali nel campione tumorale.
Poiché le cellule tumorali possono differire significativamente dalle cellule normali, i ricercatori possono stimare la purezza di un tumore utilizzando dati genomici o epigenomici ad alto rendimento. DeMix è un metodo che mira a estrarre il rapporto tra l'espressione genica delle cellule tumorali e il suo profilo di espressione da campioni misti.
DeMix presuppone che il campione misto sia costituito solo da due tipi di cellule: cellule cancerose (senza un profilo di espressione genica noto) e cellule normali (con dati di espressione genica noti).
Il funzionamento principale di DeMix si basa su modelli misti lineari, che catturano l'espressione genica di due tipi di cellule in un campione misto mediante la modellazione dei dati. L'innovazione di questo metodo è che analizza i dati eterogenei prima che vengano trasformati in logaritmo, il che può prevedere in modo più efficace l'espressione genica e le proporzioni nelle cellule tumorali.
In particolare, il flusso di lavoro di DeMix può essere suddiviso in due fasi principali: la prima fase consiste nel massimizzare la funzione di verosimiglianza basata sui dati osservati per risolvere le proporzioni tumorali sconosciute e i parametri di espressione genica delle cellule normali; la seconda fase consiste nel massimizzare la funzione di verosimiglianza in base ai dati osservati per risolvere le proporzioni tumorali sconosciute e i parametri di espressione genica delle cellule normali; il passo successivo è stimare il livello di espressione di una coppia di cellule normali e cellule tumorali per ogni campione e gene in base al tumore rapporto ottenuto nel primo passaggio.
Lo sviluppo di questo metodo si basa sulla procedura di ottimizzazione Nelder-Mead, che consente l'integrazione numerica della densità dei giunti per ottenere la precisione computazionale richiesta.
Il metodo DeMix è adattato a una varietà di scenari di dati, che si tratti di campioni abbinati con geni di riferimento o campioni non abbinati senza geni di riferimento. Questa flessibilità consente a DeMix di svolgere il suo ruolo in una varietà di ambienti di ricerca.
Sebbene in tutti i casi sia richiesto almeno un gene di riferimento, si raccomanda di utilizzarne da cinque a dieci per ridurre l'impatto dei valori anomali e identificare un insieme ottimale di stime della proporzione tumorale.DeMix presuppone che il campione misto contenga al massimo due componenti cellulari: cellule normali e cellule tumorali, e si basa sui dati disponibili per stimare i parametri di distribuzione delle cellule normali.
Con il continuo progresso della tecnologia di analisi dei dati, metodi come DeMix saranno sempre più utilizzati nella ricerca sul cancro. Ciò non solo aiuterà i ricercatori a svelare i segreti dietro l'eterogeneità dei tumori, ma potrebbe anche dare origine a nuove opzioni terapeutiche, offrendo maggiore speranza ai pazienti affetti da cancro.
In un'era così basata sui dati, dobbiamo chiederci: nella futura ricerca sul cancro, come possiamo utilizzare al meglio i geni di riferimento biologici per migliorare l'efficacia e l'accuratezza del trattamento clinico?