桑格測序是一種基於隨機加入鏈終止的二脲核苷酸的 DNA 測序方法,這項技術最早於1977年由弗雷德里克·桑格及其同事開發。這種方法在接下來的四十年間廣泛使用,並於1987年首次推出了使用自動化儀器的平板膠電泳系統。隨著技術的進步,平板膠逐漸被自動化毛細管陣列電泳所取代,大幅提升了測序的效率和準確性。
自動化桑格測序不僅減少了手動操作的需要,也能夠同時處理多達384個樣本,進一步提高了每批次的測序效率。
這種方法仍然在小規模項目以及深度測序結果的驗證中發揮著重要作用。與短讀長測序技術(例如 Illumina)相比,桑格測序的優勢在於它能產生超過500個核苷酸的 DNA 序列讀數,並保持非常低的錯誤率,準確性高達99.99%。這意味著即使在大型基因組分析中,桑格測序也能提供可靠的信息。
傳統的鏈終止法需要一條單鏈 DNA 模板、一個 DNA 引物、一種 DNA 聚合酶、正常的脫氧核苷三磷酸和改造的二脲核苷三磷酸(ddNTPs)。這些鏈終止核苷酸缺少形成磷酸二酯鍵所需的3'-OH基團,導致 DNA 聚合酶在加入ddNTP后停止延伸。
這種測序方法分為四個獨立的反應,每個反應中只加入一種二脲核苷三磷酸,最終透過膠電泳分離 DNA 片段。
這些 DNA 片段可以通過自動化的方式進行檢測,並且可視化。使用這種方法的實驗室已經能夠輔助公共衛生機構快速獲取和分析重要的基因組數據,例如 SARS-CoV-2 的測序,這在 COVID-19 大流行期間顯得尤為重要。
自動化的 DNA 測序儀器可以在一批次中測序多達384個樣本,並且每天可進行多達24次的批量運行。這些儀器不僅節省了時間,還提高了數據的準確性。這些測序反應會在不同的步驟中分開進行,然後再將樣本上載到測序儀中。
許多商業和非商業軟體包能夠自動修剪低質量的 DNA 譜痕,這提高了大數據集的處理效率。
在公共衛生的應用上,測序數據的準確性和速度對於支援患者診斷及環境監測至關重要。桑格測序成為美國疾病控制與預防中心(CDC)用於諾羅病毒防疫的“金標準”,幫助衛生部門追蹤病毒的流行趨勢並應對潛在的健康威脅。
儘管自動化桑格測序技術具有多種優勢,但在測序過程中仍存在一些挑戰。例如,序列的前15至40個鹼基可能品質較差,且在700至900鹼基之後的測序質量逐漸下降。這些問題通常依賴於先進的 base calling 軟體來進行修剪和整理,但算法的準確性仍不及人眼視覺檢查。
隨著技術的發展,基於單步桑格測序的方法應運而生,這些方法簡化了測序過程並提升了效率。
最近出現的微流控桑格測序技術,將桑格測序的多個步驟集成到一個晶片上,進一步減少了試劑消耗,並加速了重複性實驗的進行。
自動化的桑格測序不僅改變了傳統的測序流程,還擴大了其在公共衛生和基因組研究中的應用範圍。隨著技術的持續革新,未來桑格測序將如何影響我們對基因結構的理解,將成為科學界持續思考的課題?