copri il mistero tra l'assemblaggio del genoma e del trascrittoma e scopri perché a volte l'assemblaggio del trascrittoma è la scelta migliore

Con lo sviluppo di nuove tecnologie di sequenziamento, i costi del sequenziamento sono diminuiti drasticamente dal 2008 al 2012, rendendo l'assemblaggio del trascrittoma una scelta ideale per la ricerca. In passato, il costo del sequenziamento del genoma ha impedito a molti organismi non modello di ricevere sufficiente attenzione, ma tutto è cambiato con l'introduzione della tecnologia di sequenziamento ad alto rendimento (ovvero la tecnologia di sequenziamento di nuova generazione). Lo sviluppo di queste tecnologie ha non solo ridotto i costi, ma anche migliorato l'efficienza del lavoro, consentendo di estendere gli oggetti di ricerca a una gamma più ampia di organismi non modello. Ad esempio, sono stati raccolti e analizzati i trascrittomi cerebrali di ceci, vermi piatti, granchi blu delle Hawaii, coccodrilli del Nilo, serpenti del grano, draghi barbuti e tartarughe dalle orecchie rosse.

L'esame di organismi non modello può fornire nuove informazioni sui meccanismi delle "affascinanti innovazioni morfologiche" che consentono alla vita sulla Terra di prosperare.

Nei regni vegetale e animale, molte "innovazioni" come il mimetismo, la simbiosi, il parassitismo e la riproduzione asessuata non possono essere testate nei comuni organismi modello. Poiché gli assemblaggi del trascrittoma sono generalmente più economici e semplici dei genomi, questo approccio è spesso la scelta migliore per studiare organismi non modello. I trascrittomi di questi organismi potrebbero rivelare nuove proteine ​​e le loro forme varianti associate a questi fenomeni biologici unici.

Confronto tra assemblaggi di trascrittoma e genoma

Un set assemblato di trascrizioni è essenziale per gli studi iniziali sull'espressione genica. Prima dello sviluppo di programmi computazionali per l'assemblaggio del trascrittoma, i dati del trascrittoma venivano analizzati principalmente tramite la mappatura su un genoma di riferimento. Sebbene l'allineamento del genoma sia un metodo affidabile per caratterizzare le sequenze trascritte, presenta il limite di non riuscire a spiegare i cambiamenti strutturali nei trascritti di mRNA, come lo splicing alternativo. Poiché il genoma contiene tutti gli introni e gli esoni che possono apparire in una trascrizione, le varianti di splicing con allineamenti discontinui potrebbero essere trascurate come vere e proprie varianti proteiche. Anche se è disponibile un genoma di riferimento, è opportuno eseguire un assemblaggio de novo, poiché consente il recupero dei trascritti dai frammenti mancanti nel genoma master.

Differenze tra assemblaggi del trascrittoma e del genoma

A differenza dei livelli di copertura della sequenza genomica, che variano in modo casuale in base al contenuto ripetitivo del DNA non codificante, i livelli di copertura della sequenza del trascrittoma possono riflettere direttamente i livelli di espressione genica. Queste sequenze ripetitive creano anche ambiguità negli assemblaggi del genoma, mentre le ambiguità negli assemblaggi del trascrittoma spesso corrispondono a varianti di splicing o a piccoli cambiamenti tra i membri della famiglia genica. Esistono diverse ragioni per cui gli assemblatori di genomi non possono essere utilizzati direttamente per l'assemblaggio del trascrittoma. Innanzitutto, la profondità del sequenziamento del genoma è solitamente uniforme in tutto il genoma, ma la profondità delle trascrizioni può variare. In secondo luogo, nel sequenziamento del genoma entrambi i filamenti vengono sempre sequenziati, mentre l'RNA-seq può essere specifico per un filamento. In definitiva, l'assemblaggio del trascritto è più impegnativo perché le varianti del trascritto dello stesso gene possono condividere esoni ed essere difficili da risolvere in modo chiaro.

Metodologia

RNA-sequenza

Una volta estratto e purificato dalle cellule, l'RNA viene inviato a un impianto di sequenziamento ad alto rendimento, dove viene prima sottoposto a trascrizione inversa per creare una libreria di cDNA. Questi cDNA possono quindi essere frammentati in diverse lunghezze, a seconda della piattaforma di sequenziamento utilizzata. Le seguenti piattaforme utilizzano diversi tipi di tecnologie per sequenziare milioni di letture brevi, tra cui il sequenziamento 454, Illumina e SOLiD.

Algoritmo di assemblaggio

Le letture della sequenza di cDNA generate sopra verranno assemblate in trascrizioni tramite un programma di assemblaggio di trascrizioni a lettura breve. Spesso è possibile rilevare alcune variazioni degli amminoacidi, che possono riflettere diverse varianti proteiche o rappresentare geni diversi nella stessa famiglia genica o addirittura geni che condividono solo domini conservati. Sebbene questi programmi abbiano generalmente successo nell'assemblaggio dei genomi, si trovano ad affrontare sfide particolari nell'assemblaggio del trascrittoma. A differenza dell'elevata copertura di sequenza per il genoma, per il trascrittoma un'elevata copertura di sequenza può implicare sequenze abbondanti piuttosto che ripetitive. Inoltre, il sequenziamento del trascrittoma può essere specifico del filamento, nel qual caso sono presenti sia trascrizioni senso che antisenso. In definitiva, ricostruire e sezionare tutte le varianti di splicing potrebbe rivelarsi difficile.

Note funzionali

L'annotazione funzionale dei trascritti assemblati fornisce informazioni su specifiche funzioni molecolari di presunte proteine, componenti cellulari e processi biologici. Blast2GO (B2G) può annotare i dati di sequenza che non hanno ancora annotazioni GO allineando i frammenti contig assemblati con il database proteico non ridondante dell'NCBI. Si tratta di uno strumento frequentemente utilizzato negli studi genomici funzionali di specie non modello.

Validazione e controllo di qualità

Poiché è raro trovare buoni genomi di riferimento, la qualità degli assemblaggi computazionali può essere convalidata confrontando le sequenze assemblate con le letture utilizzate per generarle (senza un riferimento) o allineando le sequenze di domini genici conservati al trascrittoma o al genoma di una specie strettamente correlata (sulla base di un riferimento). Strumenti come Transrate e DETONATE eseguono analisi statistiche attraverso questi metodi per valutare la qualità dell'assemblaggio.

In questo campo della ricerca genomica in rapido sviluppo, l'assemblaggio del trascrittoma è senza dubbio uno degli strumenti fondamentali per comprendere la diversità della vita. Con una biodiversità così ricca, come possiamo applicare queste scoperte ai futuri sforzi di biotecnologia e conservazione?

Trending Knowledge

Genoma o trascrittoma? La differenza fondamentale nella scelta del metodo di assemblaggio giusto!
Con lo sviluppo di tecnologie di sequenziamento emergenti, la ricerca sul trascrittoma è entrata in una nuova era. In particolare tra il 2008 e il 2012, la significativa riduzione dei costi di sequenz
copri perché negli ultimi anni, con lo sviluppo della tecnologia di sequenziamento ad alto rendimento, lo studio degli organismi non modello è diventato più attraente e fattibile
Negli ultimi anni, il rapido sviluppo della tecnologia di sequenziamento ad alto rendimento, in particolare tra il 2008 e il 2012, ha ridotto significativamente i costi di sequenziamento, consentendo

Responses