隱藏的結構寶藏:PDB數據庫如何助力蛋白質建模?

在結構生物學中,蛋白質骨架片段庫已成功應用於各種場合,包括同源建模、新的結構預測和結構確定。這些片段庫透過簡化搜索空間,加快了對構象空間的搜尋,進而生成更高效且準確的模型。

蛋白質在離散建模時可以採取指數數量的狀態。通常,蛋白質的構象是由所有相連原子之間的二面角、鍵長和鍵角所表示。

當前,最常見的簡化方法是假設理想的鍵長和鍵角。儘管如此,這依然留有骨架的 phi-psi 角,以及每個側鏈的最多四個二面角,導致蛋白質可能的狀態數複雜度可達到 k^6 * n,其中 n 是殘基的數量,而 k 是每個二面角模型的離散狀態數。為了減少構象空間,可以使用蛋白質片段庫,而不是明確建模每個 phi-psi 角。

片段為由 5 到 15 個殘基組成的短段肽骨架,通常不包括側鏈。如果是簡化的原子表示,它們可能僅指定 C-alpha 原子的定位,或者所有骨架重原子(N、C-alpha、C carbonyl、O)的位置。側鏈通常無法使用片段庫進行建模。要建模側鏈的離散狀態,可以使用轉旋體庫方法。這種方法假設局部相互作用在穩定整體蛋白質構象中發揮了重要作用。

根據 Levinthal 的悖論,蛋白質不可能在合理的時間內採樣所有可能的構象。局部穩定的結構會減小搜索空間,使蛋白質能在毫秒的級別內摺疊。

片段庫的構建

這些片段的庫是通過對蛋白質數據庫(PDB)的分析來構建的。首先,選擇 PDB 的一個代表性子集,該子集應涵蓋多樣的結構,並且解析度良好。然後,對於每個結構,將每組 n 個連續的殘基作為樣本片段。在樣本中應用例如 k-means 聚類的算法,將其根據彼此在空間配置上的相似性聚類成 k 組。此處的參數 n 和 k 根據具體應用而定。

聚類的中心點被視為片段的代表。進一步的優化可以確保中心點具備理想的鍵幾何,因為它是通過平均其他幾何而導出的。由於片段衍生自自然界存在的結構,它們所代表的骨架片段將具有現實的鍵合幾何,這有助於避免探索有些會導致不現實幾何的完整構象角空間。該聚類可以在不考慮殘基身份的情況下進行,也可以針對特定的殘基。對於任何給定的氨基酸序列,可以利用 PDB 中相同序列的樣本來衍生聚類。

例子:環模建

在同源建模中,片段庫的常見應用是建模結構的環。通常,α-螺旋和β-片層會與模板結構進行對接,但中間的環則未被指定,需要進行預測。尋找最佳配置的環是一個 NP 困難問題。為了減少需要探索的構象空間,可以將環建模為一系列重疊的片段。然後,我們可以對該空間進行抽樣,或者如果空間現在足夠小,可以進行全面列舉。

環構造始於將所有可能的片段對齊,與三個位於環 N 端的氨基酸重疊(即錨點)。隨後,將第二片段的所有可能選擇對齊到第一片段的所有可能選擇上,確保第一片段的最後三個氨基酸與第二個片段的前面三個氨基酸重疊。

複雜性

儘管使用片段庫後狀態空間的複雜性仍為指數,但指數的程度減少了。對於一個 F-mer 片段庫,其庫中包含 L 個片段,當要對 N 殘基更加重疊每個片段的 3 個時,可能的鏈為 L[N/(F-3)] + 1。與明確建模 phi-psi 角的 K 可能組合的 KN 可能性相比,這要少得多。當然,這種複雜性隨著片段庫中片段數量 L 的增加而提高。然而,更多的片段將捕獲更大全景的片段結構,因此在模型的準確性與探索搜索空間的速度之間存在權衡。此外,對於任何固定的 L,隨著片段長度的增加,能夠被建模的結構的多樣性會減少。短片段比長片段更能涵蓋 PDB 中發現的多樣結構。最近的研究顯示,長達 15 的片段庫能在 2.0 Å 內模擬 PDB 中的 91% 的片段。

然而,在這些技術背後潛藏著更大的潛力,將改變我們對蛋白質結構的理解和預測方式,未來是否還會有更新穎的解決方法出現呢?

Trending Knowledge

蛋白質折疊的神秘:如何利用片段庫迅速預測結構?
在結構生物學領域,蛋白質的功能與結構息息相關;然而,預測這些蛋白質的三維結構卻是一項艱鉅的挑戰。為了解決這一難題,科學家們運用了蛋白質骨架片段庫,這種方法不僅提高了結構預測的效率,還對蛋白質的折疊過程帶來了新的見解。 <blockquote> 「蛋白質可以採用指數級的狀態,這使得結構預測變得極具挑戰性。」 </blockqu
打破勒文塔爾悖論:蛋白質如何在毫秒內完成摺疊?
蛋白質摺疊一直以來是生物學中的一個重要研究主題,特別是在結構生物學領域。近期研究顯示,蛋白質骨架片段庫的使用改善了結構預測的效率,從而打破了傳統的勒文塔爾悖論,這一悖論指出蛋白質不可能在生物學上合理的時間內探索所有的可能組合。 為何蛋白質摺疊如此重要? 蛋白質的結構決定了其功能,理解蛋白質摺疊的過程對於研究各種生物過程及開發新療法至關重要。然而,根據蛋白質的自由能地圖,其能夠採取
重複與創新:為何片段庫是蛋白質結構預測的遊戲改變者?
在結構生物學的領域中,蛋白質背骨片段庫(fragment libraries)已成功應用於多種結構預測中,從同源建模到新穎結構預測,再到結構確定,這些片段庫以其降低搜尋空間的複雜性,促進了更快速且準確的模型建構。 為何片段庫能改變遊戲規則? 蛋白質在被離散建模時,可以採取指數階的狀態。一般而言,蛋白質的構象被表示為連接原子的二面角、鍵長和鍵角的集合。最常見的簡化假設是理想的鍵長和

Responses