人类基因组的结构变异是一个引人注目的领域,这些变异对疾病风险的影响逐渐被科学界重视。结构变异(Structural Variation, SV)指的是生物体染色体结构的变化,包括缺失(deletions)、重复(duplications)、拷贝数变异(copy-number variants, CNV)、插入(insertions)、倒位(inversions )及易位(translocations)等。这些变异的影响范围通常介于1Kb到3Mb之间,这意味着它们的大小比一般单核苷酸 Polymorphisms(SNPs)大,但比染色体异常小。然而,随着研究的深入,结构变异的定义已扩展至包括超过50bp的事件。
根据研究,约有13%的人类基因组以正常人群结构变异来定义,而至少有240个基因存在同源缺失多态性,这显示这些基因在人类中是可有可无的。值得注意的是,与参考基因组相比,人类携带的单核苷酸变异基因组的中位值达到3.6Mbp,但结构变异的中位值高达8.9Mbp,这使得结构变异成为人类之间基因差异的主要来源。
微观结构变异能够透过光学显微镜检测到,特别是如单体型(aneuploidies)、标记染色体(marker chromosome)、大规模重组和染色体大小变异等。虽然一般认为这些结构异常的盛行率会被低估,根据推测,这些变异存在于每375名活产儿中。与此同时,亚微观结构变异因其小型特性而更难以检测。 2004年,首次利用DNA微阵列的研究显示出数十个显示拷贝数变异的基因位点,而到2015年,通过全基因组测序,发现每个基因组内可检测约5000个结构变异,大小从100个碱基对起,涵盖了约20Mb的基因组范围。
拷贝数变异(CNV)是一类重要的结构变异,涵盖插入、缺失及重复等形式。近期的研究表明,进行拷贝数变异测试的人群中有28%的疑似区域确实包含了变异。 CNV对人类基因组的影响超过了单核苷酸多态性(SNP),许多CNV位于非编码区域。这类变异通常是由于不均等重组造成的,因此广泛存在的相似序列,如LINEs和SINEs,可能是CNV产生的常见机制。
「关于结构变异的研究显示,某些病理状况如自闭症,与自发性拷贝数变异有显著关联。」
已知某些倒位与人类疾病有关。例如,在凝血因子VIII基因中出现的400kb重复倒位,是血友病A的常见成因。该基因小型倒位影响iduronate 2-sulfatase(IDS)基因则会导致亨特综合症。此外,一项最新的研究显示,一个人可拥有多达56个推定的倒位,非疾病相关的倒位可能比先前认为的普遍得多。
结构变异的复杂性逐渐被理解,包括多重倒位和插入等形式所组合的事件。这类变异的发现有助于我们理解基因与表型之间的关系。一些研究显示,自发性拷贝数变异在自闭症患者中会更频繁地破坏基因,进而贡献了5-10%的病例。结构变异不仅与疾病风险相关,还在群体遗传学中扮演着重要角色,不同变异的频率可用作推断不同地区人群之间关系的基因标记。
「一些结构变异可能是因为适应性功能而在某些物种中固定。」
现今,许多基因组浏览器和生物信息数据库提供了人类基因组中结构变异的列表。这些数据库如UCSC基因组浏览器和NCBI都能够显示结构变异的类型及其影响区域。随着新技术的发展,包括高解析度的基因组检测方法,研究者可以利用不同的方法来分析结构变异。
其中,基于阵列的比较基因组杂交技术被认为是最佳的全基因组扫描范畴,而针对特定基因组区域的检测,主要使用PCR法(如即时定量PCR)。这些技术的进步使得研究者可以更精确地识别与疾病相关的结构变异,并为疾病的早期诊断和预测提供了新的可能性。
结构变异在基因遗传与疾病风险中的角色尚需进一步探索和理解。在未来,我们或许能揭开这一领域的更多秘密,进而对人类健康和疾病的预防做出深入的贡献。你是否想过这些结构变异在未来的基因疗法中能扮演什么样的角色呢?