Com o desenvolvimento de novas tecnologias de sequenciamento, os custos de sequenciamento caíram drasticamente de 2008 a 2012, tornando a montagem do transcriptoma uma escolha ideal para pesquisa. No passado, o custo do sequenciamento do genoma impedia que muitos organismos não modelo recebessem atenção suficiente, mas tudo isso mudou com a introdução da tecnologia de sequenciamento de alto rendimento (ou seja, tecnologia de sequenciamento de última geração). O desenvolvimento dessas tecnologias não apenas reduziu custos, mas também melhorou a eficiência do trabalho, permitindo a expansão de objetos de pesquisa para uma gama maior de organismos não modelo. Por exemplo, transcriptomas cerebrais de grão-de-bico, platelmintos, caranguejos azuis havaianos, crocodilos do Nilo, cobras-do-milho, dragões barbudos e tartarugas-de-orelha-vermelha foram montados e analisados.
Examinar organismos não-modelo pode fornecer novos insights sobre os mecanismos das "fascinantes inovações morfológicas" que permitem que a vida na Terra floresça.
Nos reinos vegetal e animal, muitas "inovações" como mimetismo, simbiose, parasitismo e reprodução assexuada não podem ser testadas em organismos modelo comuns. Como as montagens do transcriptoma são geralmente mais baratas e simples que os genomas, essa abordagem geralmente é a melhor escolha para estudar organismos não modelo. Os transcriptomas desses organismos podem revelar novas proteínas e suas formas variantes associadas a esses fenômenos biológicos únicos.
Comparação de conjuntos de transcriptoma e genomaUm conjunto montado de transcrições é essencial para estudos iniciais de expressão genética. Antes do desenvolvimento de programas computacionais para montagem do transcriptoma, os dados do transcriptoma eram analisados principalmente por mapeamento para um genoma de referência. Embora o alinhamento do genoma seja um método robusto para caracterizar sequências transcritas, ele sofre da limitação de não ser capaz de levar em conta mudanças estruturais em transcrições de mRNA, como splicing alternativo. Como o genoma contém todos os íntrons e éxons que podem aparecer em uma transcrição, variantes de splicing com alinhamentos descontínuos podem ser ignoradas como variantes proteicas reais. Mesmo que um genoma de referência esteja disponível, a montagem de novo deve ser realizada, pois permite a recuperação de transcrições de fragmentos ausentes do genoma mestre.
Depois que o RNA é extraído e purificado das células, ele é enviado para uma instalação de sequenciamento de alto rendimento, onde é primeiro transcrito reversamente para criar uma biblioteca de cDNA. Esses cDNAs podem então ser fragmentados em vários comprimentos, dependendo da plataforma de sequenciamento utilizada. As seguintes plataformas utilizam diferentes tipos de tecnologias para sequenciar milhões de leituras curtas, incluindo sequenciamento 454, Illumina e SOLiD.
As leituras de sequência de cDNA geradas acima serão montadas em transcrições por meio de um programa de montagem de transcrições de leitura curta. Frequentemente, algumas variações de aminoácidos podem ser detectadas, o que pode refletir diferentes variantes de proteínas ou representar diferentes genes na mesma família de genes ou até mesmo genes que compartilham apenas domínios conservados. Embora esses programas geralmente sejam bem-sucedidos na montagem de genomas, eles enfrentam desafios únicos na montagem do transcriptoma. Ao contrário da alta cobertura de sequência para o genoma, para o transcriptoma, a alta cobertura de sequência pode implicar sequências abundantes em vez de repetitivas. Além disso, o sequenciamento do transcriptoma pode ser específico de cada fita, caso em que transcrições com e sem sentido estão presentes. No final das contas, reconstruir e dissecar todas as variantes de splicing pode ser difícil.
A anotação funcional de transcrições montadas fornece insights sobre funções moleculares específicas de proteínas putativas, componentes celulares e processos biológicos. O Blast2GO (B2G) pode anotar dados de sequência que ainda não têm anotações GO alinhando fragmentos contig montados com o banco de dados de proteínas não redundantes do NCBI. Esta é uma ferramenta frequentemente usada em estudos genômicos funcionais de espécies não modelo.
Como bons genomas de referência raramente estão disponíveis, a qualidade das montagens computacionais pode ser validada comparando sequências montadas com as leituras usadas para gerá-las (sem uma referência) ou alinhando sequências de domínio de genes conservados ao transcriptoma ou genoma de uma espécie intimamente relacionada (com base em uma referência). Ferramentas como Transrate e DETONATE realizam análises estatísticas por meio desses métodos para avaliar a qualidade da montagem.
Neste campo de rápido desenvolvimento da pesquisa genômica, a montagem do transcriptoma é, sem dúvida, uma das principais ferramentas para entender a diversidade da vida. Com uma biodiversidade tão rica, como podemos aplicar essas descobertas a futuros esforços de biotecnologia e conservação?