基因與基因體學 基因體學 生物工程學 生物技術 科學報導

第三代定序— Helicos 技術及原理

從 1977 年,Sanger 改進了定序並發明了為人稱道的 Sanger sequencing,到 1990 年代,次世代定序逐漸嶄露頭角,再到 2010 年代的第三代定序,其發展可說相當迅速。【DNA定序──過去現在與未來】

和次世代定序的大量平行定序不同,第三代定序的賣點在於單分子定序。其中最為人所知的方法包含 Pacific Biosciences 的單分子即時定序(single molecule real time sequencing, SMRT)、Oxford Nanopore Technology 的奈米孔定序法(nanopore sequencing),以及 Helicos Biosciences 的單分子螢光定序法(single molecule fluorescence sequencing)。我們在前一篇文章已經介紹過 SMRT 的技術及原理,這篇要來介紹的是 Helicos 的單分子螢光法。

介紹之前,先來點八卦吧。雖說是 Helicos Biosciences 所開發之技術,但在 2012 年 Helicos Biosciences 申請破產 [1],隨後便將此技術的專利授權給深圳瀚海基因(Direct Genomics)以及在 2013 年成立的 SeqLL [2,3]。而瀚海基因的三位創辦人之一就是最近因為使用 CRISPR 技術修改嬰兒基因而惡名昭彰的賀建奎(Jiankui He),在 2012 年為 Helicos Biosciences 老闆 Stephen Quake 底下的博士後研究員。

進入正題,他們使用的單分子螢光定序法到底是怎麼運作的呢?首先,他們採用合成式定序 (sequencing by synthesis)。簡單來說,將細胞 DNA 打散成 100-200 bp 的大小,利用末端脫氧核苷酸轉移酶(terminal deoxynucleotidyl transferase, TdT)在 DNA 的 3’ 端接上帶有螢光標記的脫氧腺苷三磷酸苷(dATP)形成的 poly-A 尾端。偵測晶片上則是鋪滿數十億條與之配對的 poly-T。當晶片上的 poly-T 與樣本 DNA 的 poly-A 尾端配對後,以雷射激發螢光並紀錄亮點,隨即移除螢光標記。之後加入帶有螢光標記之核苷酸,配對合成後,移除試劑,並以雷射激發螢光並紀錄亮點,再移除標記。重複這個過程,依序循環加入帶有螢光標記之 dATP→dCTP→dGTP→dTTP,最終便能夠定序每條 DNA 片段。此過程大約會重複 120 次,相當於 30 個循環,每次循環可產生 35Gb 的 DNA 定序數據。最後,以電腦處理這些龐大的定序資料,並對照參考基因體(reference genome),把基因體像拼圖一樣拼起來,即大功告成 [4]。

圖一、Helicos 系統的單分子螢光定序之示意圖。 圖片來源: http://www.ijerst.com/ijerstadmin/upload/IJEETC_55c167ba216a7.pdf

值得一提的是,加入的核苷酸使用了稱作 Virtual Terminator 的技術,用來避免一次合成超過一個鹼基的情況(例如: DNA 片端上有連續的 A,不會因為你加入 T 就在一回合內把全部的 A 都給配對完了)[5]。有興趣的人,請觀看下方影片。

 

這個方法的優點在於,它不像次世代定序需要先以 PCR 擴增 DNA 片段再定序,故能夠避免擴增過程中產生的錯誤,同時也節省了許多時間。但其缺點也是顯而易見:重複的洗去試劑、移除螢光標記的過程實在是太浪費試劑了!此外,較高的粗錯誤率(3-5%)需要靠重複定序來降低,無疑增加了成本。最後,在大量定序上,第三代定序的平均價格上比不過次世代定序,因此他要在市場上嶄露頭角勢必要尋找別的賣點。所謂商場如戰場,存活下來的就是贏家。今年 11 月才傳出定序龍頭 Illumina 要以 12 億美元併購 PacBio 的消息 [6]。且讓我們耐心等待最後誰能在這場定序競爭中勝出。

最後放個三家第三代定序的比較表 [7-9]

公司 SeqLL (Helicos) Pacific Biosciences Oxford Nanopore
技術平台 True single molecule sequencing (tSMS) Single molecule real time sequencing (SMRT) MinION
DNA 讀取長度 30 bp(最大 55bp) 3,000-15,000 bp(最大 60kb) 最大 230-300 kb
單次最大資料量 35 Gb 1-7 Gb/cell 42 Gb
單次反應產生讀數 ~十億 5.5-37 萬 440 萬
定序時間 最多 8 天 0.5-6 小時 兩天內
粗錯誤率 3-5% 13-15% 2-13%

參考資料:

  1. Helicos BioSciences Files for Chapter 11 Bankruptcy Protection https://www.genomeweb.com/sequencing/helicos-biosciences-files-chapter-11-bankruptcy-protection#.XAaRX2gzaHs
  2. 瀚海基因(Direct Genomics)http://www.directgenomics.com/index.php
  3. SeqLL. http://seqll.com/
  4. Ari, Sule & Arıkan, Muzaffer. (2016). Next-Generation Sequencing: Advantages, Disadvantages, and Future. 109-135. 10.1007/978-3-319-31703-8_5.
  5. Bowers, J., Mitchell, J., Beer, E., Buzby, P. R., Causey, M., Efcavitch, J. W., … Thompson, J. F. (2009). Virtual terminator nucleotides for next-generation DNA sequencing. Nature Methods, 6(8), 593-595. doi:10.1038/nmeth.1354 https://www.nature.com/articles/nmeth.1354
  6. Illumina to Acquire Pacific Biosciences for Approximately $1.2 Billion, Broadening Access to Long-Read Sequencing and Accelerating Scientific Discovery – PacBio. (2018, November 1). Retrieved from https://www.pacb.com/press_releases/illumina-to-acquire-pacific-biosciences-for-approximately-1-2-billion-broadening-access-to-long-read-sequencing-and-accelerating-scientific-discovery/
  7. Ozsolak, F. (2012). Third-generation sequencing techniques and applications to drug discovery. Expert opinion on drug discovery, 7(3), 231-43.
  8. Yeh, C., Liu, Z., & Tsai, W. (n.d.). Advanced Applications of Next-Generation Sequencing Technologies to Orchid Biology. In Next-generation sequencing and bioinformatics for plant science. Retrieved from doi.org/10.21775/cimb.027.051
  9. 李思元、莊以光(2010)。DNA 定序技術之演進與發展。生物醫學暨檢驗雜誌,22(2),49-57。

撰文│紀威佑
審稿│楊仁龍

About the author

紀威佑

紀威佑

臺大醫學系畢業,曾為臺大iGEM代表隊成員,曾於台大、中研院、AMC實驗室進行實習。對科普推廣與寫作有很大的興趣,希望能和志同道合的朋友交流,並做為知識的傳播者為科學社群盡一份心力。

Leave a Comment