桑格测序是一种基于随机加入链终止的二脲核苷酸的 DNA 测序方法,这项技术最早于1977年由弗雷德里克·桑格及其同事开发。这种方法在接下来的四十年间广泛使用,并于1987年首次推出了使用自动化仪器的平板胶电泳系统。随着技术的进步,平板胶逐渐被自动化毛细管阵列电泳所取代,大幅提升了测序的效率和准确性。
自动化桑格测序不仅减少了手动操作的需要,也能够同时处理多达384个样本,进一步提高了每批次的测序效率。
这种方法仍然在小规模项目以及深度测序结果的验证中发挥着重要作用。与短读长测序技术(例如 Illumina)相比,桑格测序的优势在于它能产生超过500个核苷酸的 DNA 序列读数,并保持非常低的错误率,准确性高达99.99%。这意味着即使在大型基因组分析中,桑格测序也能提供可靠的信息。
传统的链终止法需要一条单链 DNA 模板、一个 DNA 引物、一种 DNA 聚合酶、正常的脱氧核苷三磷酸和改造的二脲核苷三磷酸(ddNTPs)。这些链终止核苷酸缺少形成磷酸二酯键所需的3'-OH基团,导致 DNA 聚合酶在加入ddNTP后停止延伸。
这种测序方法分为四个独立的反应,每个反应中只加入一种二脲核苷三磷酸,最终透过胶电泳分离 DNA 片段。
这些 DNA 片段可以通过自动化的方式进行检测,并且可视化。使用这种方法的实验室已经能够辅助公共卫生机构快速获取和分析重要的基因组数据,例如 SARS-CoV-2 的测序,这在 COVID-19 大流行期间显得尤为重要。
自动化的 DNA 测序仪器可以在一批次中测序多达384个样本,并且每天可进行多达24次的批量运行。这些仪器不仅节省了时间,还提高了数据的准确性。这些测序反应会在不同的步骤中分开进行,然后再将样本上载到测序仪中。
许多商业和非商业软体包能够自动修剪低质量的 DNA 谱痕,这提高了大数据集的处理效率。
在公共卫生的应用上,测序数据的准确性和速度对于支援患者诊断及环境监测至关重要。桑格测序成为美国疾病控制与预防中心(CDC)用于诺罗病毒防疫的“金标准”,帮助卫生部门追踪病毒的流行趋势并应对潜在的健康威胁。
尽管自动化桑格测序技术具有多种优势,但在测序过程中仍存在一些挑战。例如,序列的前15至40个碱基可能品质较差,且在700至900碱基之后的测序质量逐渐下降。这些问题通常依赖于先进的 base calling 软体来进行修剪和整理,但算法的准确性仍不及人眼视觉检查。
随着技术的发展,基于单步桑格测序的方法应运而生,这些方法简化了测序过程并提升了效率。
最近出现的微流控桑格测序技术,将桑格测序的多个步骤集成到一个晶片上,进一步减少了试剂消耗,并加速了重复性实验的进行。
总的来说,自动化的桑格测序不仅改变了传统的测序流程,还扩大了其在公共卫生和基因组研究中的应用范围。随着技术的持续革新,未来桑格测序将如何影响我们对基因结构的理解,将成为科学界持续思考的课题?