émystifiez le mystère entre l’assemblage du génome et du transcriptome et découvrez pourquoi l’assemblage du transcriptome est parfois le meilleur choix

Avec le développement de nouvelles technologies de séquençage, les coûts de séquençage ont chuté de façon spectaculaire entre 2008 et 2012, faisant de l’assemblage du transcriptome un choix idéal pour la recherche. Dans le passé, le coût du séquençage du génome empêchait de nombreux organismes non modèles de recevoir une attention suffisante, mais tout cela a changé avec l’introduction de la technologie de séquençage à haut débit (c’est-à-dire la technologie de séquençage de nouvelle génération). Le développement de ces technologies a non seulement réduit les coûts, mais également amélioré l’efficacité du travail, permettant l’élargissement des objets de recherche à une gamme plus large d’organismes non modèles. Par exemple, les transcriptomes cérébraux des pois chiches, des vers plats, des crabes bleus hawaïens, des crocodiles du Nil, des serpents des blés, des dragons barbus et des tortues à oreilles rouges ont été assemblés et analysés.

L’examen d’organismes non modèles peut apporter de nouvelles perspectives sur les mécanismes des « innovations morphologiques fascinantes » qui permettent à la vie sur Terre de s’épanouir.

Dans les règnes végétal et animal, de nombreuses « innovations » telles que le mimétisme, la symbiose, le parasitisme et la reproduction asexuée ne peuvent pas être testées dans des organismes modèles courants. Étant donné que les assemblages de transcriptome sont généralement moins chers et plus simples que les génomes, cette approche est souvent le meilleur choix pour étudier les organismes non modèles. Les transcriptomes de ces organismes peuvent révéler de nouvelles protéines et leurs formes variantes associées à ces phénomènes biologiques uniques.

Comparaison des assemblages du transcriptome et du génome

Un ensemble assemblé de transcriptions est essentiel pour les études initiales d’expression génétique. Avant le développement de programmes informatiques pour l’assemblage du transcriptome, les données du transcriptome étaient principalement analysées par mappage sur un génome de référence. Bien que l'alignement du génome soit une méthode robuste pour caractériser les séquences transcrites, il souffre de la limitation de ne pas pouvoir tenir compte des changements structurels dans les transcrits d'ARNm, tels que l'épissage alternatif. Étant donné que le génome contient tous les introns et exons susceptibles d’apparaître dans une transcription, les variantes d’épissage présentant des alignements discontinus peuvent être négligées en tant que variantes protéiques réelles. Même si un génome de référence est disponible, un assemblage de novo doit être effectué car il permet la récupération des transcriptions à partir de fragments manquants du génome maître.

Différences entre les assemblages de transcriptome et de génome

Contrairement aux niveaux de couverture des séquences génomiques, qui varient de manière aléatoire en fonction du contenu répétitif de l’ADN non codant, les niveaux de couverture des séquences du transcriptome peuvent refléter directement les niveaux d’expression des gènes. Ces séquences répétitives créent également des ambiguïtés dans les assemblages du génome, tandis que les ambiguïtés dans les assemblages du transcriptome correspondent souvent à des variantes d’épissage ou à de petits changements entre les membres de la famille des gènes. Il existe plusieurs raisons pour lesquelles les assembleurs de génomes ne peuvent pas être utilisés directement pour l’assemblage du transcriptome. Premièrement, la profondeur du séquençage du génome est généralement uniforme sur l’ensemble du génome, mais la profondeur des transcriptions peut varier. Deuxièmement, les deux brins du séquençage du génome sont toujours séquencés, alors que l’ARN-seq peut être spécifique à un brin. En fin de compte, l’assemblage des transcriptions est plus difficile car les variantes de transcription du même gène peuvent partager des exons et être difficiles à résoudre clairement.

Méthodologie

ARN-seq

Une fois l’ARN extrait et purifié des cellules, il est envoyé vers une installation de séquençage à haut débit où il est d’abord rétrotranscrit pour créer une bibliothèque d’ADNc. Ces ADNc peuvent ensuite être fragmentés en différentes longueurs en fonction de la plateforme de séquençage utilisée. Les différentes plateformes suivantes utilisent différents types de technologies pour séquencer des millions de lectures courtes, notamment le séquençage 454, Illumina et SOLiD.

Algorithme d'assemblage

Les séquences d'ADNc générées ci-dessus seront assemblées en transcriptions via un programme d'assemblage de transcriptions à lecture courte. Souvent, quelques variations d'acides aminés peuvent être détectées, ce qui peut refléter différentes variantes de protéines ou peut représenter différents gènes dans la même famille de gènes ou même des gènes qui ne partagent que des domaines conservés. Bien que ces programmes réussissent généralement à assembler les génomes, ils sont confrontés à des défis uniques dans l’assemblage du transcriptome. Contrairement à la couverture de séquence élevée pour le génome, pour le transcriptome, une couverture de séquence élevée peut impliquer des séquences abondantes plutôt que répétitives. De plus, le séquençage du transcriptome peut être spécifique à un brin, auquel cas les transcrits sens et antisens sont présents. En fin de compte, la reconstruction et la dissection de toutes les variantes d’épissage pourraient s’avérer difficiles.

Notes fonctionnelles

L'annotation fonctionnelle des transcriptions assemblées fournit des informations sur les fonctions moléculaires spécifiques des protéines putatives, des composants cellulaires et des processus biologiques. Blast2GO (B2G) peut annoter les données de séquence qui n'ont pas encore d'annotations GO en alignant les fragments de contig assemblés avec la base de données de protéines non redondantes du NCBI. Il s’agit d’un outil fréquemment utilisé dans les études de génomique fonctionnelle des espèces non modèles.

Validation et contrôle qualité

Étant donné que de bons génomes de référence sont rarement disponibles, la qualité des assemblages informatiques peut être validée en comparant les séquences assemblées aux lectures utilisées pour les générer (sans référence) ou en alignant les séquences de domaines génétiques conservées sur le transcriptome ou le génome d'une espèce étroitement apparentée (sur la base d'une référence). Des outils comme Transrate et DETONATE effectuent des analyses statistiques via ces méthodes pour évaluer la qualité de l'assemblage.

Dans ce domaine de recherche génomique en développement rapide, l’assemblage du transcriptome est sans aucun doute l’un des outils essentiels pour comprendre la diversité de la vie. Avec une biodiversité aussi riche, comment pouvons-nous appliquer ces résultats aux futurs efforts de biotechnologie et de conservation ?

Trending Knowledge

Génome ou transcriptome ? La différence clé dans le choix de la bonne méthode d'assemblage !
Avec le développement des nouvelles technologies de séquençage, la recherche sur le transcriptome est entrée dans une nouvelle ère. En particulier entre 2008 et 2012, la baisse significative des coûts
écouvrez pourquoi ces dernières années, avec le développement de la technologie de séquençage à haut débit, l’étude d’organismes non modèles est devenue plus attractive et réalisable
Ces dernières années, le développement rapide de la technologie de séquençage à haut débit, en particulier entre 2008 et 2012, a considérablement réduit les coûts de séquençage, permettant aux cherche

Responses