在生物化学和结构生物学的研究中,化学位移指数(Chemical Shift Index,简称CSI)是一种广泛使用的技术,专门用于分析蛋白质的核磁共振光谱(NMR)。这项技术可以通过使用仅由骨干化学位移数据来显示和识别蛋白质二级结构的位点(例如,开始和结束位置)以及类型(β-链、α-螺旋和随机线圈区域)。从1992年起,David S. Wishart便开始发展这项技术,最初是针对1Hα化学位移进行分析,并于1994年扩展至包含13C骨干化学位移。
化学位移指数技术的核心在于,它利用了氨基酸残基在α-螺旋和β-折板中的化学位移变化的特征。
该方法的基本原理是,1Hα化学位移在α-螺旋中通常向上偏移(即在NMR光谱的右侧),而在β-折板中则向下偏移(即在NMR光谱的左侧)。还可以在背骨13C化学位移中发现类似的趋势。
CSI方法是一种基于图形的技术,使用氨基酸特定的数位滤波器将每个指定的骨干化学位移值转换为简单的三状态指数(-1、0、+1)。这种方法生成的图表,在视觉上变得更加清晰易懂。如果某氨基酸残基的上偏移1Hα化学位移(相对于它的氨基酸特定随机线圈值)大于0.1 ppm,则该残基被分配为-1;如果下偏移大于0.1 ppm,则被分配为+ 1;若化学位移变化小于0.1 ppm,则被分配为0。
通过将这个三状态指数绘制为条形图,可以轻松识别β-链(+1值的簇)、α-螺旋(-1值的簇)以及随机线圈段(0值的簇)。
这样的图表使得蛋白质二级结构的识别更加简便。而在进行二级结构的种类识别时,简单的观察即可识别出β-链和α-螺旋等结构。
仅使用1Hα化学位移和简单的聚类规则(β-链的三个或更多垂直条形簇,以及α-螺旋的四个或更多垂直条形簇),CSI方法的二级结构识别准确率通常在75%到80%之间。这一表现部份上取决于NMR数据集的质量以及用于识别蛋白质二级结构的技术(手动或程式化)。
通过将1H和13C化学位移的CSI图合并生成一个综合指数,准确率可达到85%至90%。
随着研究的深入,科学家发现不仅只有α-螺旋的化学位移和二级结构存在关联,β-折板的结构也同样显示出此类化学位移变化。
化学位移与蛋白质二级结构之间的关联首次由John Markley及其同事在1967年描述。随着现代二维NMR技术的发展,测量更多的蛋白质化学位移变得可能。到了1990年代,收集到足够的13C和15N化学位移分配后,科学家发现这些化学位移变化的趋势可以为CSI的发展提供有力的支持。
尽管CSI方法有其独特的优势,但也存在一些局限性。当化学位移的分配不完整或错误时,其性能会受到影响。更重要的是,该方法对于随机线圈修正值的选择相当敏感。通常,CSI方法在识别α-螺旋(超过85%的准确率)时表现优于β-折板(低于75%的准确率)。此外,它未能识别其他类型的二级结构,如β-转角。
由于这些缺陷,许多替代的以CSI为基础的方法相继被提出,提供了更全面的二级结构识别手段。
自1992年首次描述以来,CSI方法已被用于数千种肽和蛋白质的二级结构特征分析。由于其易于理解,且无需专业的计算程序即可实施,这使得它在科学界广受欢迎。许多常用的NMR数据处理程序,如NMRView和各种网络伺服器,均已将CSI方法纳入这些工具框架,以推动其应用。
这种方法在蛋白质研究的应用前景广泛,不仅限于二级结构的辨识功能,还可以进一步促进我们对蛋白质功能的理解与探索。面对未来,能否开发出新的技术来弥补CSI方法的不足呢?