ノムとトランスクリプトームアセンブリ間の謎を解明し、トランスクリプトームアセンブリが最良の選択となる場合がある理由を学びます

新しいシーケンシング技術の開発により、シーケンシングのコストは 2008 年から 2012 年にかけて劇的に低下し、トランスクリプトームアセンブリは研究にとって理想的な選択肢となりました。過去には、ゲノム配列決定のコストが原因で、多くの非モデル生物が十分な注目を集めることができませんでしたが、ハイスループット配列決定技術(次世代配列決定技術)の導入により、状況は一変しました。これらの技術の開発により、コストが削減されただけでなく、作業効率も向上し、研究対象をより広範囲の非モデル生物に拡大することが可能になりました。例えば、ヒヨコマメ、扁形動物、ハワイのワニ、ナイルワニ、コーンスネーク、アゴヒゲトカゲ、ミシシッピアカミミガメの脳トランスクリプトームが集められ、分析されています。

非モデル生物を調べることで、地球上の生命の繁栄を可能にした「魅力的な形態学的革新」のメカニズムに関する新たな洞察が得られる可能性がある。

植物界や動物界では、擬態、共生、寄生、無性生殖などの多くの「革新」は、一般的なモデル生物ではテストできません。トランスクリプトームアセンブリは一般にゲノムよりも安価でシンプルであるため、このアプローチは非モデル生物の研究に最適な選択肢となることがよくあります。これらの生物のトランスクリプトームにより、これらのユニークな生物学的現象に関連する新しいタンパク質とその変異体が明らかになる可能性があります。

トランスクリプトームとゲノムアセンブリの比較

組み立てられた転写産物のセットは、初期の遺伝子発現研究に不可欠です。トランスクリプトームアセンブリ用の計算プログラムが開発される前は、トランスクリプトームデータは主に参照ゲノムにマッピングすることによって分析されていました。ゲノムアライメントは転写された配列を特徴付ける強力な方法ですが、選択的スプライシングなどの mRNA 転写産物の構造変化を考慮できないという制限があります。ゲノムには転写産物に現れる可能性のあるすべてのイントロンとエクソンが含まれているため、不連続な配列を持つスプライスバリアントは実際のタンパク質バリアントとして見落とされる可能性があります。参照ゲノムが利用可能な場合でも、マスターゲノムから欠落している断片からの転写産物の回復を可能にするため、de novo アセンブリを実行する必要があります。

トランスクリプトームとゲノムアセンブリの違い

非コード DNA の反復コンテンツによってランダムに変化するゲノム配列カバレッジ レベルとは異なり、トランスクリプトーム配列カバレッジ レベルは遺伝子発現レベルを直接反映します。これらの反復配列はゲノムアセンブリにも曖昧さを生み出しますが、トランスクリプトームアセンブリの曖昧さは多くの場合、スプライスバリアントまたは遺伝子ファミリーメンバー間の小さな変化に対応します。ゲノムアセンブラーをトランスクリプトームアセンブリに直接使用できない理由はいくつかあります。まず、ゲノム配列の深さは通常ゲノム全体で一貫していますが、転写産物の深さは変化する可能性があります。第二に、ゲノム配列決定では両方の鎖が常に配列決定されますが、RNA-seq では鎖特異的に配列決定できます。最終的には、同じ遺伝子からの転写産物バリアントがエクソンを共有し、明確に解決することが難しいため、転写産物のアセンブリはより困難になります。

方法論

RNAシーケンス

RNA は細胞から抽出され、精製されると、ハイスループット シーケンシング施設に送られ、そこでまず逆転写されて cDNA ライブラリが作成されます。これらの cDNA は、使用するシーケンス プラットフォームに応じてさまざまな長さに断片化できます。以下のさまざまなプラットフォームは、454 シーケンシング、イルミナ、SOLiD など、さまざまな種類のテクノロジーを利用して、何百万もの短い読み取りをシーケンスします。

アセンブリアルゴリズム

上記で生成された cDNA 配列リードは、ショートリード転写アセンブリ プログラムによって転写物に組み立てられます。多くの場合、いくつかのアミノ酸変異が検出されますが、これは異なるタンパク質変異を反映している場合もあれば、同じ遺伝子ファミリー内の異なる遺伝子、あるいは保存されたドメインのみを共有する遺伝子を表している場合もあります。これらのプログラムはゲノムの組み立てには一般的に成功していますが、トランスクリプトームの組み立てにおいては特有の課題に直面しています。ゲノムの高配列カバレッジとは異なり、トランスクリプトームの場合、高配列カバレッジは反復配列ではなく豊富な配列を意味する場合があります。さらに、トランスクリプトーム配列決定は鎖特異的であり、その場合にはセンス転写産物とアンチセンス転写産物の両方が存在します。最終的には、すべてのスプライスバリアントを再構築して分析することは困難であることが判明する可能性があります。

機能に関する注意事項

組み立てられた転写産物の機能的注釈は、推定タンパク質、細胞成分、および生物学的プロセスの特定の分子機能に関する洞察を提供します。 Blast2GO (B2G) は、組み立てられたコンティグ断片を NCBI の非冗長タンパク質データベースと整合させることにより、まだ GO アノテーションがないシーケンス データにアノテーションを付けることができます。これは、非モデル種の機能ゲノム研究で頻繁に使用されるツールです。

検証と品質管理

優れた参照ゲノムが利用できることはめったにないため、計算アセンブリの品質は、アセンブルされた配列を、それらを生成するのに使用されたリードと比較することによって(参照なし)、または保存された遺伝子ドメイン配列を近縁種のトランスクリプトームまたはゲノムにアラインメントすることによって(参照に基づいて)検証できます。 Transrate や DETONATE などのツールは、これらの方法を通じて統計分析を実行し、アセンブリの品質を評価します。

急速に発展しているゲノム研究の分野において、トランスクリプトームアセンブリは間違いなく生命の多様性を理解するための中核的なツールの 1 つです。生物多様性が豊かなこの研究結果を、将来のバイオテクノロジーや保全活動にどのように応用できるでしょうか?

Trending Knowledge

ゲノムかトランスクリプトームか?適切なアセンブリ方法を選択するための重要な違い!
新たなシーケンシング技術の発展により、トランスクリプトーム研究は新たな時代に入りました。特に 2008 年から 2012 年にかけて、シーケンシング コストが大幅に低下したことにより、多くの非モデル生物のトランスクリプトームを組み立てて分析することが可能になりました。この変化は、特定の生物における表現型の変異の発見にとどまらず、地球上の生命の多様性と生物学的メカニズムをより深く理解することを可能に
年、ハイスループットシーケンス技術の開発により、非モデル生物の研究がより魅力的かつ実現可能になっている理由を発見してください
近年、特に 2008 年から 2012 年にかけてのハイスループット シーケンス技術の急速な発展により、シーケンス コストが大幅に削減され、研究者が従来の限界を突破して、モデル以外の生物のゲノムやトランスクリプトームの探索を開始できるようになりました。これらの技術の普及により、以前は少数の典型的な生物に限定されていた研究が、生物多様性のより広範な探求へと変わりました。 ハイスループット

Responses