基因與基因體學 基因體學 科學報導

幫細胞貼標籤:單一細胞分析的想法由來

自古以來人類最喜歡,也最擅長的就是給人「貼標籤」,也就是對事物加以「分類」。從亞里斯多德以外觀為生物分類,到十八世紀林奈(Carl von Linné)以二名法普及化了動植物的分類,雷文霍克(Antonie van Leeuwenhoek)以自製顯微鏡詳盡的紀錄微生物與細胞的型態,無一不是在幫事物作分類。

看到顯微鏡底下形形色色的細胞,很自然的就會把類似型態的分作一群。有了組織染色後,就更能看清楚細胞的型態。除了型態以外,以功能、分泌的分子、細胞內表現的蛋白質、細胞表面的蛋白質(例如:分化群(cluster of differentiation, CD)目前已經編號至 CD371),越來越多分類的指標任君選擇。也因此,科學家發現許多看起來相似的細胞,可以用其他特徵再分成更多次分類:外觀類似的免疫細胞卻能以各種表面蛋白質的組合分成不同分類;同一個癌症組織中的每個細胞的基因表現也可能相當不同。以現在的技術,我們只要選用夠多的特徵,理論上能區分出組織中的每一個細胞

舉例來說,若我們要分類血球細胞,可以把其體積畫在一維直線上,形成一維分佈。這個散佈圖已經大致能將細胞分成幾個大群體(紅血球、白血球、血小板等)。此時加入第二個特徵(如細胞內分子複雜度等),就可以形成二維散佈圖,這個圖形能更進一步地將白血球分類為嗜中性球(neutrophils)、單核球(monocytes)、淋巴球(lymphocyte)等。持續增加特徵數量便能構成越多的維度。事實上,我們甚至可以使用細胞中的每種基因的表現,亦即 mRNA 量做為特徵,構成一個在高維空間中的散佈圖。超過三維的散佈圖雖然難以想像,但對於電腦而言,他就是由一堆點構成的散佈圖,稱之為特徵空間(feature space)。正所謂「物以類聚」,我們能預期同類的細胞的散佈會鄰近彼此,便能以此原則來分類這些數據。

圖、以流式細胞儀分析為例,僅以細胞大小(前散射光)與細胞內複雜度(側散射光)即可將白血球細胞粗略分類。(圖片來源:https://www.youtube.com/watch?v=TDRhCWaYRsg)

傳統的 RNA 定序( bulk RNA-seq)使用一群細胞來分析(population-averaged assay),個別細胞的異質性(heterogeneity)會被平均掉。在這種分析中大多數無意義的雜訊都會被濾掉,而脫穎而出的特徵,通常都有其生理意義。然而,這種分析方法可能有幾個缺點:第一、少部分重要細胞的數據被多數細胞平均掉。第二、當細胞的特徵並非常態分佈,而是雙峰分佈或是全有全無時,平均資料無法反映真實狀況。

圖、(A) 分析一群細胞時,次群體的資訊有可能會被整個群體給平均掉。若這群細胞是雙峰分佈,以平均值來估計細胞時將會失準。此時加上更多指標有助於分類細胞。(B) 每個待分析的細胞都是特徵空間中的為一個點,我們可以用人工或電腦輔助對一群細胞加以分類。(圖片來源:doi:10.1016/j.cell.2010.04.033)

因此,科學家發展出了單細胞 RNA 定序技術 (single-cell RNA sequencing, scRNA-seq)。這類技術而言,雖然能解決上述缺點,但也產生了一個問題:究竟次分類該要多細才好?一般認為,相同分類的細胞必須要執行相同的功能、對相同的刺激有相同的反應、活化相同的基因等。這些指標必須有其生理意義,並可以被檢驗。如何找出有意義的指標來分類細胞就成了個挑戰:我們必須在可解讀性(interpretability)和完整度(comprehensiveness)之間作取捨 [1]。

目前已發展出一些用以降噪的演算法,可以把資料的維度降低,而不至於喪失太多重要的數據。同時,科學家在實驗端發展單細胞分離技術以及定序前的文庫製備方式(library preparation),計算分析端發展出許多監督式(supervised)與非監督式(unsupervised)的演算法及數學建模方式,提升分析的準確度 [2]。在大數據、機器學習與分析技術已成熟的現今,單細胞相關技術與應用如雨後春筍。Science 的 2018 年度科學突破之首就是單細胞層級的細胞譜系研究(development cell by cell),使用了單細胞 RNA 定序(single cell RNA sequencing)等技術 [3]。想必這些技術將對科學研究帶來重大革命。

參考資料

  1. Altschuler, S. J., & Wu, L. F. (2010). Cellular Heterogeneity: Do Differences Make a Difference? Cell, 141(4), 559–563. doi:10.1016/j.cell.2010.04.033
  2. Hwang, B., Lee, J. H., & Bang, D. (2018). Single-cell RNA sequencing technologies and bioinformatics pipelines. Experimental & Molecular Medicine, 50(8). doi:10.1038/s12276-018-0071-8
  3. 2018 Breakthrough of the Year: Development Cell by Cell https://vis.sciencemag.org/breakthrough2018/finalists/#cell-development

撰文|紀威佑
審稿|陳帝亢

About the author

紀威佑

紀威佑

臺大醫學系畢業,曾為臺大iGEM代表隊成員,曾於台大、中研院、AMC實驗室進行實習。對科普推廣與寫作有很大的興趣,希望能和志同道合的朋友交流,並做為知識的傳播者為科學社群盡一份心力。

留言

  • […] 本月我們介紹的是目前當紅以及未來的一大趨勢 — 單一細胞分析(single-cell analysis)。這種概念大概就像我們一直研究一整包的 M&M’s 巧克力,本質都是巧克力但其實拿出來看,每顆其實各有特色,於是決定開始一顆一顆的研究。但多年的研究下來,卻總有存在某個不可抗因素默默地影響著研究結果,那就是細胞與細胞之間存在的異質性(heterogeneity)。因此,若能進行單一細胞的表徵差異進行分析,想必可以更加了解各個疾病的機制。首先,如何將同種類的單一細胞更進一步的貼上標籤及是科學家的第一大挑戰。但多年的研究下來,卻總有存在某個不可抗因素默默地影響著研究結果,那就是細胞與細胞之間存在的異質性(heterogeneity)。因此,若能進行單一細胞的表徵差異進行分析,想必可以更加了解各個疾病的機制。首先,如何將同種類的單一細胞更進一步的貼上標籤及是科學家的第一大挑戰。 […]

  • […] 本月我們介紹的是目前當紅以及未來的一大趨勢 — 單一細胞分析(single-cell analysis)。這種概念大概就像我們一直研究一整包的 M&M’s 巧克力,本質都是巧克力但其實拿出來看,每顆其實各有特色,於是決定開始一顆一顆的研究。但多年的研究下來,卻總有存在某個不可抗因素默默地影響著研究結果,那就是細胞與細胞之間存在的異質性(heterogeneity)。因此,若能進行單一細胞的表徵差異進行分析,想必可以更加了解各個疾病的機制。首先,如何將同種類的單一細胞更進一步的貼上標籤及是科學家的第一大挑戰。 […]

Leave a Comment