隨著新興測序技術的發展,轉錄組的研究已經進入了一個全新的時代。尤其在2008年至2012年間,測序成本的顯著下降讓許多非模式生物也有機會進行轉錄組的組裝與分析。這變化超越了尋找特定生物的表型變異,讓我們能夠更全面地理解地球上生命的多樣性與生物學機制。
「轉錄組組裝的最大好處在於其具備揭示新蛋白質及其亞型的潛力,這些蛋白質或許在特定的生物現象中扮演著關鍵角色。」
轉錄組的組裝方法主要分為兩種:de novo組裝與基於參考的組裝。對於那些尚未建立完整基因組的非模式生物,de novo轉錄組組裝顯然是更加合適的選擇。這種方法不依賴於先前的基因組序列,讓研究人員能夠探索未知的基因轉錄信息。
在過去,轉錄組數據的分析主要依賴於對照已有的參考基因組。然而,這種方法未必能涵蓋所有的mRNA結構變異,尤其是當涉及到交替剪接時,許多轉錄變體可能因無法不連續地映射到基因組而被錯過。因此,即使有參考基因組,進行de novo 組裝仍然是必要的,因為新的組裝可以恢復那些在參考基因組中缺失的轉錄本。
轉錄組的覆蓋深度可以直接反映基因的表達水平,而基因組的覆蓋深度則通常會受重複序列的影響。此外,轉錄組組裝面對的最大挑戰之一就是同一基因中不同的轉錄變體可能共享外顯子,這讓它們的辨識變得更加複雜。
RNA的提取和純化後,樣本會送至高通量的測序設施進行反轉錄,得到cDNA文庫。根據不同的平台,這些cDNA會被切割成特定長度,然後利用不同的技術進行測序,包括454測序、Illumina和SOLiD等。
轉錄本的序列數據會用短讀長轉錄組裝程序來組裝成轉錄本。由於轉錄本可能相似但存在氨基酸變異,這些變異可以反映不同的蛋白質亞型。很多組裝程序可以用來進行這一過程,不過轉錄組組裝面臨許多獨特的挑戰。
「大多數短讀長組裝器遵循兩種基本算法:重疊圖和de Bruijn圖,其中de Bruijn圖由於計算需求相對較低而更受青睞。」
對於組裝好的轉錄本進行功能註釋,可以深入了解其潛在的生物學功能。使用如Blast2GO的工具,可以對未註釋的序列數據進行基於基因本體論的挖掘。此過程可以幫助識別轉錄本所參與的生物過程及其分子功能。
由於能夠得到良好參考基因組的情況十分少見,因此需要通過將組裝序列與原始讀取進行對比來驗證其品質。短序列的過濾也是必要的,因為這些短序列通常無法有效折疊形成功能蛋白。
在市面上,有許多的組裝軟體可以用於生成轉錄組。例如,SOAPdenovo-Trans和Trinity等工具各有特點,這些程序不僅能夠高效地組裝轉錄本,還能解釋不同的剪接事件和基因表達量。
在這個快速發展的領域中,基因組還是轉錄組的組裝方法選擇,最終取決於研究者的需求與所研究生物的特性。每種方法都有其優缺點,研究者是否已經選擇了一條最適合自己所需的研究道路呢?