新しいシーケンシング技術の開発により、シーケンシングのコストは 2008 年から 2012 年にかけて劇的に低下し、トランスクリプトームアセンブリは研究にとって理想的な選択肢となりました。過去には、ゲノム配列決定のコストが原因で、多くの非モデル生物が十分な注目を集めることができませんでしたが、ハイスループット配列決定技術(次世代配列決定技術)の導入により、状況は一変しました。これらの技術の開発により、コストが削減されただけでなく、作業効率も向上し、研究対象をより広範囲の非モデル生物に拡大することが可能になりました。例えば、ヒヨコマメ、扁形動物、ハワイのワニ、ナイルワニ、コーンスネーク、アゴヒゲトカゲ、ミシシッピアカミミガメの脳トランスクリプトームが集められ、分析されています。
非モデル生物を調べることで、地球上の生命の繁栄を可能にした「魅力的な形態学的革新」のメカニズムに関する新たな洞察が得られる可能性がある。
植物界や動物界では、擬態、共生、寄生、無性生殖などの多くの「革新」は、一般的なモデル生物ではテストできません。トランスクリプトームアセンブリは一般にゲノムよりも安価でシンプルであるため、このアプローチは非モデル生物の研究に最適な選択肢となることがよくあります。これらの生物のトランスクリプトームにより、これらのユニークな生物学的現象に関連する新しいタンパク質とその変異体が明らかになる可能性があります。
トランスクリプトームとゲノムアセンブリの比較組み立てられた転写産物のセットは、初期の遺伝子発現研究に不可欠です。トランスクリプトームアセンブリ用の計算プログラムが開発される前は、トランスクリプトームデータは主に参照ゲノムにマッピングすることによって分析されていました。ゲノムアライメントは転写された配列を特徴付ける強力な方法ですが、選択的スプライシングなどの mRNA 転写産物の構造変化を考慮できないという制限があります。ゲノムには転写産物に現れる可能性のあるすべてのイントロンとエクソンが含まれているため、不連続な配列を持つスプライスバリアントは実際のタンパク質バリアントとして見落とされる可能性があります。参照ゲノムが利用可能な場合でも、マスターゲノムから欠落している断片からの転写産物の回復を可能にするため、de novo アセンブリを実行する必要があります。
RNA は細胞から抽出され、精製されると、ハイスループット シーケンシング施設に送られ、そこでまず逆転写されて cDNA ライブラリが作成されます。これらの cDNA は、使用するシーケンス プラットフォームに応じてさまざまな長さに断片化できます。以下のさまざまなプラットフォームは、454 シーケンシング、イルミナ、SOLiD など、さまざまな種類のテクノロジーを利用して、何百万もの短い読み取りをシーケンスします。
上記で生成された cDNA 配列リードは、ショートリード転写アセンブリ プログラムによって転写物に組み立てられます。多くの場合、いくつかのアミノ酸変異が検出されますが、これは異なるタンパク質変異を反映している場合もあれば、同じ遺伝子ファミリー内の異なる遺伝子、あるいは保存されたドメインのみを共有する遺伝子を表している場合もあります。これらのプログラムはゲノムの組み立てには一般的に成功していますが、トランスクリプトームの組み立てにおいては特有の課題に直面しています。ゲノムの高配列カバレッジとは異なり、トランスクリプトームの場合、高配列カバレッジは反復配列ではなく豊富な配列を意味する場合があります。さらに、トランスクリプトーム配列決定は鎖特異的であり、その場合にはセンス転写産物とアンチセンス転写産物の両方が存在します。最終的には、すべてのスプライスバリアントを再構築して分析することは困難であることが判明する可能性があります。
組み立てられた転写産物の機能的注釈は、推定タンパク質、細胞成分、および生物学的プロセスの特定の分子機能に関する洞察を提供します。 Blast2GO (B2G) は、組み立てられたコンティグ断片を NCBI の非冗長タンパク質データベースと整合させることにより、まだ GO アノテーションがないシーケンス データにアノテーションを付けることができます。これは、非モデル種の機能ゲノム研究で頻繁に使用されるツールです。
優れた参照ゲノムが利用できることはめったにないため、計算アセンブリの品質は、アセンブルされた配列を、それらを生成するのに使用されたリードと比較することによって(参照なし)、または保存された遺伝子ドメイン配列を近縁種のトランスクリプトームまたはゲノムにアラインメントすることによって(参照に基づいて)検証できます。 Transrate や DETONATE などのツールは、これらの方法を通じて統計分析を実行し、アセンブリの品質を評価します。
急速に発展しているゲノム研究の分野において、トランスクリプトームアセンブリは間違いなく生命の多様性を理解するための中核的なツールの 1 つです。生物多様性が豊かなこの研究結果を、将来のバイオテクノロジーや保全活動にどのように応用できるでしょうか?