癌症被視為基因體疾病的概念已建立多年,在 2013 年促成泛癌症分析計畫 (pan-cancer analysis project)[1],由 The Cancer Genome Atlas Research Network(TCGA)[2] 主導,旨在完整、多面向地了解不同種類癌症的共同與差異點。乘著基因體定序技術進步以及資料庫的建立,相關研究不斷擴張。
癌症基因共同作用於許多調控路徑和蛋白複合體,展現廣泛的突變異質性(mutational heterogeneity),以及由少數常見變異和大量稀有變異所構成的長尾現象(long-tail phenomenon),使得癌症相關突變基因與路徑的顯著分析變得困難。 TCGA 團隊使用 HotNet2 pan-cancer network [3, 4] 演算分析,結合從 12 種癌症類型收集的資料,辨認出 16 個 subnetworks,包含已知組成癌症訊息路徑的基因和如 cohesin 等與癌症關係尚不明者,後者僅由此分析法辨認出,符合癌症基因突變稀有性的假設,且透過 HotNet2 分析出的某些稀有體細胞突變(somatic mutations)亦在不同癌症類型中具有共同發生(co-occurrence),蛋白質結構資料也支持這些發現。
上一代 HotNet 採用的 directed heat diffusion 模型,能夠同時評估基因變化的統計顯著性和交互作用,根據已知的 SNVs(single nucleotide variants)和 CNAs(copy number aberrations)為個別基因設定熱能與其傳輸方向,用以代表其訊息傳遞路徑,找出周圍的 subnetworks。然而,作者的目標是想要同時找出頻繁與稀有變異頻率的個別基因與其交互作用及蛋白質網絡,若是採用 HotNet 分析,像是 TP53 這種高變異頻率的基因產生的高密集熱點擴散效應會增加周圍基因的偽陽性機率。因此, HotNet2 進一步考慮突變再發率 (mutational recurrence)等變數,降低偽陽性而使得有意義的 subnetworks 得以浮現,其敏感性和特異性和其他演算法相比為高。
透過 HotNet2 的分析,作者提出幾項重要的結果與觀念:首先,此分析法找到了 92 個帶有稀有變異的基因,且這些變異基因廣泛存在各個類型的癌症,同時這些基因全部涵蓋在上述提及的 subnetworks 中。甚至在單一型癌症裏已熟稔的單一基因變異,會以稀有變異的形式(同一 complex,不同成員)存在在另一型癌症當中。其次,這些稀有變異的 subnetworks 間常常存在共同發生的變異,然而這些變異通常不可能一齊發生,顯示這些 subnetworks 彼此間操演著迥異的生物功能。總結這些發現,癌症基因變異的藍圖就像是一群山脈,由頻繁變異基因架構的山群與稀有變異基因的丘群共同組成。泛癌症分析計畫像是為了界定山脈的分佈範圍與其歸屬的丘地而發起,以期未來能應用於生物標誌(biomarkers)的診斷和癌症的治療。
撰稿人 | 吳奕儒
參考文獻:
- Leiserson, M. D. M., Vandin, F., Wu, H.-T., Dobson, J. R., Eldridge, J. V., Thomas, J. L., … Raphael, B. J. (2015). Pan-Cancer Network Analysis Identifies Combinations of Rare Somatic Mutations across Pathways and Protein Complexes. Nature Genetics, 47(2), 106–114. http://doi.org/10.1038/ng.3168
- UC Santa Cruz. (2014, Nov 13). Ed Talk – The Quest to Conquer Cancer: Computer Geeks to the Rescue! [Video File]. Retrieved from https://goo.gl/0uTz6k
- Raphael Lab. (2017, May 1). Retrieved from https://goo.gl/269mnM
- Killock, D. (2015) Genetics: HotNet2—see the wood for the trees. Nature Reviews Clinical Oncology 12, 66. doi:10.1038/nrclinonc.2014.234