在生物学和生物技术日益发展的今天,科学家们越来越认识到蛋白质结构在揭示其功能和进化历史方面的重要性。尽管传统上序列相似性被视为推断蛋白质同源性的一种主要方法,但结构相似性的指标显示出更高的可靠性,特别是当涉及到蛋白质超家族的分类时。
蛋白质超家族是推断共同祖先的最大分组,这种关系通常是通过结构比对来推断的,即使在序列上没有显而易见的相似性。
蛋白质超家族的识别依赖于多种方法。透过结构相似性,可以辨识出许多演化上相近的蛋白质成员,而即使它们在序列上完全不同,这些蛋白质的功能和催化机制可能仍然是保守的。
结构比序列更具演变保守性。这意味着即使是经历了漫长的进化过程,具有高度相似结构的蛋白质,其氨基酸序列可能完全不同。这在生物学上引起了极大的关注,因为许多生物研究都基于序列分析来推断蛋白质的功能和来源。
蛋白质的次级结构元素和三级结构特征通常会高度保守,而许多催化机制在蛋白质超家族中也是一种保守现象,即使底物特异性可能有很大的不同。
据估计,约有66%至80%的真核生物蛋白质拥有多个结构域,而这些结构域也通常混合在一起,形成所谓的“领域架构”。这意味着,虽然简单的序列比较可能无法揭示这些蛋白质的存在关系,但结构比较却显示出了它们之间隐含的关联性。
蛋白质超家族展现了科学家们对于共同祖先的理解和研究的最新进展。这些超家族代表了根据直接证据可以识别的最大演化分组,其中一些成员在所有生命王国中都有出现,表明这些超家族的祖先存在于所有生命的最后共同祖先(LUCA)中。
与同一物种中的蛋白质相比,超家族成员之间的基因重复现象(平行性)更常见,这使得通过结构相关性来研究基因的起源变得更加可行。
当然,尽管结构相似性提供了多方面的见解,但是在某些情况下,结构相似的蛋白质之间却不会显示出明显的序列相似性,这进一步使得蛋白质结构相较于序列成为一个更上一层楼的分析工具。
随着蛋白质结构研究技术的进步,科学界正逐步认识到结构在解释蛋白质功能、进化和相互动作中的重要性,这为基因组学提供了重要的补充资料。面对未来,在研究世界上数以千计的不同蛋白质时,我们是否应该更多地关注它们的结构而非序列?