Con lo sviluppo di tecnologie di sequenziamento emergenti, la ricerca sul trascrittoma è entrata in una nuova era. In particolare tra il 2008 e il 2012, la significativa riduzione dei costi di sequenziamento ha reso possibile l'assemblaggio e l'analisi dei trascrittomi di molti organismi non modello. Questo cambiamento va oltre la semplice individuazione di variazioni fenotipiche in organismi specifici, consentendoci di comprendere più a fondo la diversità e i meccanismi biologici della vita sulla Terra.
"Il vantaggio più grande dell'assemblaggio del trascrittoma è la sua potenzialità di rivelare nuove proteine e le loro isoforme che possono svolgere ruoli chiave in specifici fenomeni biologici."
Esistono due metodi principali per l'assemblaggio del trascrittoma: l'assemblaggio de novo e l'assemblaggio basato su riferimenti. Per gli organismi non modello per i quali non è stato ancora stabilito un genoma completo, l'assemblaggio de novo del trascrittoma è ovviamente la scelta più appropriata. Questo approccio non si basa su sequenze genomiche precedenti, consentendo ai ricercatori di esplorare informazioni sconosciute sulla trascrizione genica.
In passato, l'analisi dei dati del trascrittoma si basava principalmente sul confronto con i genomi di riferimento esistenti. Tuttavia, questo approccio potrebbe non coprire tutte le variazioni strutturali dell'mRNA, soprattutto quando è coinvolto lo splicing alternativo, e molte varianti di trascrizione potrebbero non essere individuate perché non possono essere mappate in modo discontinuo sul genoma. Pertanto, anche con un genoma di riferimento, è comunque necessario eseguire un assemblaggio de novo, poiché il nuovo assemblaggio può recuperare le trascrizioni mancanti nel genoma di riferimento.
La profondità di copertura del trascrittoma può riflettere direttamente il livello di espressione del gene, mentre la profondità di copertura del genoma è solitamente influenzata dalle sequenze ripetitive. Inoltre, una delle sfide più grandi che l'assemblaggio del trascrittoma deve affrontare è che diverse varianti del trascritto nello stesso gene possono condividere esoni, il che rende più complicata la loro identificazione.
Dopo l'estrazione e la purificazione dell'RNA, i campioni verranno inviati a un impianto di sequenziamento ad alto rendimento per la trascrizione inversa e l'ottenimento di una libreria di cDNA. A seconda della piattaforma, questi cDNA verranno tagliati in lunghezze specifiche e poi sequenziati utilizzando diverse tecnologie, tra cui il sequenziamento 454, Illumina e SOLiD.
I dati della sequenza delle trascrizioni verranno assemblati in trascrizioni utilizzando un programma di assemblaggio di trascrizioni di lettura breve. Poiché le trascrizioni possono essere simili ma presentare variazioni negli amminoacidi, queste variazioni possono riflettere diverse isoforme proteiche. Per eseguire questo processo è possibile utilizzare diversi programmi di assemblaggio, ma l'assemblaggio del trascrittoma presenta numerose sfide particolari.
"La maggior parte degli assemblatori di letture brevi segue due algoritmi di base: grafico di sovrapposizione e grafico di De Bruijn, con il grafico di De Bruijn preferito per i suoi requisiti computazionali relativamente bassi."
L'annotazione funzionale dei trascritti assemblati può fornire una comprensione approfondita delle loro potenziali funzioni biologiche. Utilizzando strumenti come Blast2GO, è possibile estrarre dati di sequenze non annotate basandosi sull'ontologia genetica. Questo processo può aiutare a identificare i processi biologici in cui sono coinvolti i trascritti e le loro funzioni molecolari.
Poiché è raro avere a disposizione un buon genoma di riferimento, è necessario verificare la qualità della sequenza assemblata confrontandola con le letture grezze. Il filtraggio delle sequenze brevi è necessario anche perché queste sequenze brevi solitamente non riescono a ripiegarsi efficacemente in proteine funzionali.
Esistono molti software di assemblaggio disponibili sul mercato che possono essere utilizzati per generare trascrittomi. Ad esempio, strumenti come SOAPdenovo-Trans e Trinity hanno le loro caratteristiche uniche. Questi programmi non solo possono assemblare in modo efficiente i trascritti, ma anche tenere conto di diversi eventi di splicing e livelli di espressione genica.
In questo campo in rapida evoluzione, la scelta del metodo di assemblaggio del genoma o del trascrittoma dipende in ultima analisi dalle esigenze del ricercatore e dalle caratteristiche dell'organismo studiato. Ogni metodo ha i suoi vantaggi e svantaggi. I ricercatori hanno scelto un percorso di ricerca che si adatta meglio alle loro esigenze?