內含子是基因內的不表達或不運行的核苷酸序列。這些序列在成熟的 RNA 產品中不會被轉換為蛋白質。相對於內含子,外顯子是通過 RNA 處理後連接形成的成熟 RNA。內含子在絕大多數真核生物及許多真核病毒的基因中均有存在,但在細菌和古菌(原核生物)中則相對稀少。這引出了有關內含子存在的作用及其演變的深刻問題。
在1977年,Phillip Allen Sharp 和 Richard J. Roberts 獨立發現了內含子的存在,為其在1993年獲得諾貝爾生理學或醫學獎。
內含子是由美國生化學家沃爾特·吉爾伯特首次提出的術語,他描述道「基因必須以轉錄單元的概念來替代,這些轉錄單元包含將在成熟信使 RNA 中消失的區域,我建議將其稱為內含子(intron)」。最初的研究在腺病毒的蛋白質編碼基因中發現了內含子,隨後逐步識別了其他 RNA 基因中的內含子。內含子的這種位置和功能使其在不同物種中變得複雜,也引發了有關內含子稀少性的問題。
根據不同基因組的研究,內含子的頻率在各個生物中十分不均。舉例來說,在脊椎動物的核基因組中,內含子通常相當豐富,但在某些真核微生物中,如酵母,人們卻幾乎找不到內含子。這種分佈差異提示了進化過程中內含子的獲得和丟失。
具體而言,人體基因的平均內含子數量為每個基因8.4個,而單細胞真菌Encephalitozoon cuniculi卻只有0.0075個。
雖然所有含內含子的 RNA 分子在剃刀的拼接過程中表現得類似,但通過 DNA 序列分析以及 RNA 剪接反應的遺傳和生化分析,已經識別出了至少四種類型的內含子。
其中包括:核蛋白質編碼基因中的 spliceosomal 內含子、轉移 RNA 基因中的 tRNA 內含子、以及可以自我剪接的 group I 和 group II 內含子。
儘管內含子不編碼蛋白質,但它們在基因表達調控中扮演著重要角色。某些內含子能夠通過進一步處理生成功能性 RNA。此外,交替剪接的能力使一個基因能夠生成多種蛋白質,進一步增加了其生物多樣性。
這導致了不僅是基因的表達,還影響了基因組的演變。內含子似乎在接受進化壓力的同時,保留著其在特定位置的功能。
內含子的喪失和獲得是隨著進化過程不斷發生的事件。許多比較研究揭示了內含子喪失和獲得的實例,並提出了各種機制來解釋這一現象。反轉錄病毒介導的內含子喪失以及基因組刪除是獲得內含子的兩種主要方式。
然而,內含子的獲得機制卻一直有爭議,包括內含子轉移、重複基因組重複與插入反轉錄病毒,等等。
儘管內含子被認為是在基因組中的「廢物」,但它們的生物學功能和進化歷程揭示了許多重要的基因調控機制。而在某些生物中,為何內含子能夠如此稀少,是否意味著進化選擇了更精簡的基因組設計?