傳統製藥方法以生物製造和化學合成為主,必須測試數種化合物、經過人體試驗,才可能開發出新藥;縱使如此,在投入大量時間和資源下,能成功開發出新藥的可能性依舊很低。隨著生物技術的發展,科學家也得以使用高速篩選系統(High and Ultra-high Throught Screening, UHTS)、蛋白質組學等以電腦科學為導向的開發方式,讓藥物開發過程變得更有效率。近年來,大數據分析與人工智慧、機器學習(Machine Learning)等技術的引入,可大幅減少不必要的錯誤嘗試,在開發初期便選汰掉不適合的候選藥物,得以降低製藥成本和時間 [1]。
除了藥物開發,多種藥物的組合療法也慢慢開始嘗試以機器學習的方式輔助,或預測不同藥物間的加乘效果 [2]。與單一藥物進行治療相比,正確的用藥組合可提高藥效、降低抗藥性;然而,不同藥物間的交互作用可能對患者有害,其反覆試驗的過程也需投入大量成本和時間,如何在不同藥物和細胞株(基因組)間預測協同和拮抗作用仍有待考驗。
在深度神經網路(Deep Neural Network, DNN)的使用下,Kristina Preuer 等人開發出 DeepSynergy 這套開源工具,得以處理巨量且複雜的數據,並提取更多資料特徵(feature)。DeepSynergy 以前饋神經網路(feed forward neural network)為架構,輸入層神經元會輸入兩種藥物的化學性質和細胞株的基因表現作為特徵向量,經過隱藏層的深度協同網路轉換,最終可輸出預測的協同分數(synergy score),代表該藥物組合對某一細胞株的交互作用,分數值可代表協同和拮抗作用。研究團隊在此研究中,使用包含 23062 個樣本的數據集進行訓練和預測,每個樣本由兩種藥物和一個細胞株基因組構成,分別為 38 種抗癌藥物和 39 種人類腫瘤細胞株,將最後計算的協同分數與過往藥物實驗結果比較,證實 DeepSynergy 預測出來的分數與其相符,亦減少實驗驗證所需的時間和成本。此外,團隊也比較了其他幾種機器學習方法,如隨機森林(Random Forest)、支持向量機(Support Vector Machine, SVM)、梯度提升法(Gradient Boosting Machine)等,得到了 ROC 的曲線下面積(Area under the curve, AUC)為 0.9 的結果,整體準確度優於上述傳統機器學習方法。
總結來說,DeepSynergy 對於癌細胞株之藥物組合的交互作用取得很不錯的預測成果,除了進一步用(藥物和細胞株)數據更大量的資料集進行訓練和預測外,也預期將來應用於抗生素和抗真菌藥物等,在既有藥物之組合中提供一個與開發新藥不同、且且更有效率的方向。
參考文獻:
[1] Hongming Chen, Ola Engkvist, Yinhai Wang, Marcus Olivecrona, Thomas Blaschke. The rise of deep learning in drug discovery. Drug Discovery Today, Volume 23, Issue 6, 2018, Pages 1241-1250, ISSN 1359-6446. DOI: 10.1016/j.drudis.2018.01.039.
[2] Ianevski, A., Giri, A.K., Gautam, P. et al. Prediction of drug combination effects with a minimal set of experiments. Nat Mach Intell 1, 568–577 (2019). DOI: 10.1038/s42256-019-0122-4.
[3] Kristina Preuer, Richard P I Lewis, Sepp Hochreiter, Andreas Bender, Krishna C Bulusu, Günter Klambauer, DeepSynergy: predicting anti-cancer drug synergy with Deep Learning, Bioinformatics, Volume 34, Issue 9, 01 May 2018, Pages 1538–1546, DOI: 10.1093/bioinformatics/btx806.
撰文|吳冠廷
審稿|謝典戰