要定序 CpG 甲基化等標記,目前常見的方法是亞硫酸鹽定序法(bisulfite sequencing)。此方法使用亞硫酸鹽處理 DNA 樣本,亞硫酸鹽會將一般的胞嘧啶(C)轉成尿嘧啶(U),但甲基胞嘧啶(5-methylcytosine, 5-mC)則不受影響。依據此結果比較處理前後之樣本,便可得知 5-mC 的分佈。由於亞硫酸鹽會破壞 DNA 樣本,故最近也有以酵素取代化學反應的處理方法(ACE-seq),有利於定序微量DNA 樣本 [1]。這些方法的基礎都在於比較樣本在處理前後的變化,通常只能用在 5-mC,而且不能「直接」定序帶有表觀遺傳標記的鹼基。
不過,第三代定序做到了。單分子即時定序(single molecule real time sequencing, SMRT)以及奈米孔定序法(nanopore sequencing) 能夠直接使用 DNA 來定序表觀遺傳標記。
先來個小故事。SMRT 使用的方法是將一段雙股 DNA 頭尾分別加上特別的髮夾彎序列,形成稱作 SMRTbell(長得像啞鈴,下圖)的環狀 DNA。【詳見 SMRT 技術及原理】雖說像啞鈴,但定序過程中像是一串念珠。固定在孔洞下方的 DNA 聚合酶抓著這串念珠,利用帶螢光的 ATCG 原料合成新的DNA,在過程中放出螢光。這些螢光和聚合酶的速率同步,因此可以藉由測量螢光來得知聚合酶的動態。我們可以測量螢光發出的時間點、長度,以及兩個螢光之間的間隔(interpulse duration, IPD)。
既然能即時「看到」聚合酶組裝新股 DNA,那我們一定會想了解聚合酶的速率是否會因為模板的組成而有所不同。因此 2010 年,PacBio 的科學家測試了 E. coli 的 DNA 定序,首先使用 PCR 擴增的 DNA 來定序,發現不同 DNA 序列會導致不同的平均延遲(IPD),就好像 DNA 聚合酶拼拼圖的速度會隨著序列不同而有所變化,延遲大多在一秒以內。之後,他們使用了 E. coli 的原生 DNA(native DNA),發現了類似的現象——除了一個不同點:GATC 這個序列居然會讓 IPD 延遲到兩秒(下圖)!這可有趣了,因為 E. coli 中有個稱作 Dam(DNA adenine methyltransferase)的酵素專門在 GATC 中的 A 進行甲基化,而 PCR 擴增的 DNA 中當然不會帶有這個甲基標記 [2]。這是否代表我們能用 SMRT 來分辨 DNA 標記了?答案是肯定的。
研究發現,DNA 聚合酶在遇到非一般 ATCG 鹼基的狀況下,會有延遲的現象。就好像寫考卷時只要遇到考古題都能秒答,但只要題幹稍微改變,你就會遲疑一下(然而還是給出正解),而透過測量短暫的遲疑,我們就能回推問題是否有變。最後發現不得了,不只常見的表觀遺傳標記會有延遲,連 DNA 破壞產生的各種化學標記、變化(如紫外線造成的胸腺嘧啶二聚體(thymine dimers))都會有此現象 [2]。
不過這樣還不算是「直接」定序了如 5-mC 等標記,充其量只能說是定序了 C,但是其異常的延遲暗示了這個 C 可能是 5-mC。那麼,多「異常」才夠呢?這就涉及統計檢定了,背後又是一堆統計原理(誰說生統沒有用!)。此外,不是只有帶有標記的鹼基的延遲會受到影響,其附近的鹼基也會受到不等的延遲 [2]。另外還有一些零零總總的技術問題待解決。總之,科學家們現在正在用各種方法充實背後的技術層面 [3,4],期待有一天能建立好三代定序相關的表觀遺傳定序方法。
對了,Oxford Nanopore 定序平台也有類似的應用,礙於篇幅,有興趣的讀者可以自己去查 [5,6],亦可參考【第三代定序 — Oxford nanopore 技術及原理】。
參考資料:
- Schutsky, E. K., DeNizio, J. E., Hu, P., Liu, M. Y., Nabel, C. S., Fabyanic, E. B., … Kohli, R. M. (2018). Nondestructive, base-resolution sequencing of 5-hydroxymethylcytosine using a DNA deaminase. Nature Biotechnology. doi:10.1038/nbt.4204
- Flusberg, B. A., Webster, D. R., Lee, J. H., Travers, K. J., Olivares, E. C., Clark, T. A., Korlach, J., … Turner, S. W. (2010). Direct detection of DNA methylation during single-molecule, real-time sequencing. Nature methods, 7(6), 461-5.
- Suzuki, Y., Korlach, J., Turner, S. W., Tsukahara, T., Taniguchi, J., Qu, W., … Morishita, S. (2016). AgIn: measuring the landscape of CpG methylation of individual repetitive elements. Bioinformatics, 32(19), 2911–2919. doi:10.1093/bioinformatics/btw360
- Zhu, S., Beaulaurier, J., Deikus, G., Wu, T. P., Strahl, M., Hao, Z., … Fang, G. (2018). Mapping and characterizing N6-methyladenine in eukaryotic genomes using single-molecule real-time sequencing. Genome Research, 28(7), 1067–1078. doi:10.1101/gr.231068.117
- Laszlo, A. H., Derrington, I. M., Brinkerhoff, H., Langford, K. W., Nova, I. C., Samson, J. M., Bartlett, J. J., Pavlenok, M., … Gundlach, J. H. (2013). Detection and mapping of 5-methylcytosine and 5-hydroxymethylcytosine with nanopore MspA. Proceedings of the National Academy of Sciences of the United States of America, 110(47), 18904-9.
- Schreiber, J., Wescoe, Z. L., Abu-Shumays, R., Vivian, J. T., Baatar, B., Karplus, K., & Akeson, M. (2013). Error rates for nanopore discrimination among cytosine, methylcytosine, and hydroxymethylcytosine along individual DNA strands. Proceedings of the National Academy of Sciences of the United States of America, 110(47), 18910-5.
撰文│紀威佑
審稿│楊仁龍