基因與基因體學 基因體學 科學報導

幫細胞貼標籤:單一細胞分析的想法由來

自古以來人類最喜歡,也最擅長的就是給人「貼標籤」,也就是對事物加以「分類」。從亞里斯多德以外觀為生物分類,到十八世紀林奈(Carl von Linné)以二名法普及化了動植物的分類,雷文霍克(Antonie van Leeuwenhoek)以自製顯微鏡詳盡的紀錄微生物與細胞的型態,無一不是在幫事物作分類。

看到顯微鏡底下形形色色的細胞,很自然的就會把類似型態的分作一群。有了組織染色後,就更能看清楚細胞的型態。除了型態以外,以功能、分泌的分子、細胞內表現的蛋白質、細胞表面的蛋白質(例如:分化群(cluster of differentiation, CD)目前已經編號至 CD371),越來越多分類的指標任君選擇。也因此,科學家發現許多看起來相似的細胞,可以用其他特徵再分成更多次分類:外觀類似的免疫細胞卻能以各種表面蛋白質的組合分成不同分類;同一個癌症組織中的每個細胞的基因表現也可能相當不同。以現在的技術,我們只要選用夠多的特徵,理論上能區分出組織中的每一個細胞

舉例來說,若我們要分類血球細胞,可以把其體積畫在一維直線上,形成一維分佈。這個散佈圖已經大致能將細胞分成幾個大群體(紅血球、白血球、血小板等)。此時加入第二個特徵(如細胞內分子複雜度等),就可以形成二維散佈圖,這個圖形能更進一步地將白血球分類為嗜中性球(neutrophils)、單核球(monocytes)、淋巴球(lymphocyte)等。持續增加特徵數量便能構成越多的維度。事實上,我們甚至可以使用細胞中的每種基因的表現,亦即 mRNA 量做為特徵,構成一個在高維空間中的散佈圖。超過三維的散佈圖雖然難以想像,但對於電腦而言,他就是由一堆點構成的散佈圖,稱之為特徵空間(feature space)。正所謂「物以類聚」,我們能預期同類的細胞的散佈會鄰近彼此,便能以此原則來分類這些數據。

圖、以流式細胞儀分析為例,僅以細胞大小(前散射光)與細胞內複雜度(側散射光)即可將白血球細胞粗略分類。(圖片來源:https://www.youtube.com/watch?v=TDRhCWaYRsg)

傳統的 RNA 定序( bulk RNA-seq)使用一群細胞來分析(population-averaged assay),個別細胞的異質性(heterogeneity)會被平均掉。在這種分析中大多數無意義的雜訊都會被濾掉,而脫穎而出的特徵,通常都有其生理意義。然而,這種分析方法可能有幾個缺點:第一、少部分重要細胞的數據被多數細胞平均掉。第二、當細胞的特徵並非常態分佈,而是雙峰分佈或是全有全無時,平均資料無法反映真實狀況。

圖、(A) 分析一群細胞時,次群體的資訊有可能會被整個群體給平均掉。若這群細胞是雙峰分佈,以平均值來估計細胞時將會失準。此時加上更多指標有助於分類細胞。(B) 每個待分析的細胞都是特徵空間中的為一個點,我們可以用人工或電腦輔助對一群細胞加以分類。(圖片來源:doi:10.1016/j.cell.2010.04.033)

因此,科學家發展出了單細胞 RNA 定序技術 (single-cell RNA sequencing, scRNA-seq)。這類技術而言,雖然能解決上述缺點,但也產生了一個問題:究竟次分類該要多細才好?一般認為,相同分類的細胞必須要執行相同的功能、對相同的刺激有相同的反應、活化相同的基因等。這些指標必須有其生理意義,並可以被檢驗。如何找出有意義的指標來分類細胞就成了個挑戰:我們必須在可解讀性(interpretability)和完整度(comprehensiveness)之間作取捨 [1]。

目前已發展出一些用以降噪的演算法,可以把資料的維度降低,而不至於喪失太多重要的數據。同時,科學家在實驗端發展單細胞分離技術以及定序前的文庫製備方式(library preparation),計算分析端發展出許多監督式(supervised)與非監督式(unsupervised)的演算法及數學建模方式,提升分析的準確度 [2]。在大數據、機器學習與分析技術已成熟的現今,單細胞相關技術與應用如雨後春筍。Science 的 2018 年度科學突破之首就是單細胞層級的細胞譜系研究(development cell by cell),使用了單細胞 RNA 定序(single cell RNA sequencing)等技術 [3]。想必這些技術將對科學研究帶來重大革命。

參考資料

  1. Altschuler, S. J., & Wu, L. F. (2010). Cellular Heterogeneity: Do Differences Make a Difference? Cell, 141(4), 559–563. doi:10.1016/j.cell.2010.04.033
  2. Hwang, B., Lee, J. H., & Bang, D. (2018). Single-cell RNA sequencing technologies and bioinformatics pipelines. Experimental & Molecular Medicine, 50(8). doi:10.1038/s12276-018-0071-8
  3. 2018 Breakthrough of the Year: Development Cell by Cell https://vis.sciencemag.org/breakthrough2018/finalists/#cell-development

撰文|紀威佑
審稿|陳帝亢

About the author

紀威佑

紀威佑

臺大醫學系畢業,曾為臺大iGEM代表隊成員,曾於台大、中研院、AMC實驗室進行實習。對科普推廣與寫作有很大的興趣,希望能和志同道合的朋友交流,並做為知識的傳播者為科學社群盡一份心力。

Leave a Comment