(圖片來源:The Economist, 2011 [http://goo.gl/LMwyPX])
還記得 <駭客任務> 救世主 Neo 連上電腦主機後,便可進入母體,與其他程式互動甚至和病毒打鬥?還記得 <阿凡達> 原本雙腳殘廢的男主角躺進機器裡,便可控制阿凡達,進入他們的世界?甚至遠在二十年前,日本動畫 <攻殼機動隊> 所建構西元 2030 年的世界,意識或靈魂可以操控各種機器的軀殼……
(圖片來源:<駭客任務> [http://goo.gl/aSxtGJ]; <阿凡達> [http://goo.gl/jsMY9C]; <攻殼機動隊> [http://goo.gl/pi9xqG])
科幻小說與電影描繪的世界,一直是科學家追求的夢想。而這個新興領域,統稱為腦機介面 (Brain-computer interface, BCI,亦稱brain-machine interface, BMI)。Investigator 七月份很高興邀請到 UC San Diego Bioengineering 博士班學生-徐聖修學長為我們介紹腦機介面這個研究領域與最新趨勢!
腦機介面的三個要素
腦機介面,顧名思義,就是提供大腦和機器 (如電腦) 之間溝通的介面。現任職於紐約州衛生局的 Jonathan Wolpaw 醫生,在 2002 年 Clinical Neurophysiology 發表的 BCI 回顧論文,定義腦機介面為:一個不需經由周邊神經和肌肉就能讓大腦與外界溝通的系統1。
如何偵測腦部活動?如何從腦波中判讀人的意念?如何用意念來控制機器或電腦?這三個問題是腦機介面領域的核心。因此 Wolpaw 等人提出腦機介面系統,由以下三個元素構成:量測腦波訊號 (Signal Acquisition)、提取訊號特徵 (Feature Extraction)、轉換成機器指令 (Translation Algorithm)。如圖一系統區塊圖所示。
圖一、腦機介面系統區塊圖(圖片來源2)
文章開始前,讀者不妨先看一段由法國 BCI 團隊 OpenViBE 提供的介紹影片[http://goo.gl/TkYU6H],對於整個腦機介面的架構和運作先有初步的概念。
這篇文章裡,將從腦機介面的發展歷史出發 (I);重頭戲在介紹BCI系統的三個核心步驟:量測腦波訊號 (II)、提取訊號特徵 (III)、轉換成機器指令 (IV) 的原理和方法;而後會舉幾個腦機介面常見的應用 (V);文末會總結並簡述此領域的挑戰 (VI)。
I. 長期累積、快速崛起──腦機介面的發展歷史
人的大腦仍是科學上未解之謎。最早期的腦科學,只能從解剖腦傷病人來研究。自從 1924 年德國醫生 Hans Berger 首次從人的頭皮上記錄到人腦發出的微弱電磁波 (Electroencephalography, EEG),並發現腦波出現的振盪訊號與腦部疾病相關,開啟了探究大腦奧秘的新途徑。1970 年代,不少科學家開始嘗試用腦波訊號作為與機器溝通的管道。其中最成功的要屬當時 UCLA BCI 實驗室主持人 Jacques Vidal 的團隊,做出利用視覺刺激反應 (第III章會介紹),控制游標走迷宮的腦機介面3。並於 1973 年發表的論文4中出現腦機介面 (brain-computer interface) 一詞。
腦機介面另一個主軸是採用侵入式電極得到的訊號 (Intracortical recordings)。神經科學家很早就開始以侵入式電極研究神經細胞的電化學行為,但一直到 1990 年代,Utah 大學的 Richard Normann 教授開發了多電極的 Utah array,並展示從近一百個電極訊號有辦法作為腦機介面控制簡單任務5。另一方面 Miguel Nicolelis 和 John Chapin 也發展了多電極量測及訊號處理技術,此種侵入式電極訊號的腦機介面才開始快速發展 (不過以老鼠、猴子為主),並於 2000 年成功利用猴子腦訊號控制遠端的機器手臂執行相同動作6。現任 Duke 大學巴西籍的 Nicolelis 教授寫了一本 Beyond Boundaries (中譯本名為 <念力>) 的科普書7,回憶當初的研究過程並詳細介紹此類腦機介面的發展與未來,值得一讀。
圖片來源:[http://goo.gl/Up5S9N]
21 世紀開始,腦機介面以極快的速度發展,不只每年論文量以指數成長,世界知名的 BCI 團隊不下 20 個,許多公司也相繼推出大眾化商品。趁這股熱潮,就讓我們來認識什麼是腦機介面。
II. 神經元的怒吼──腦波訊號的原理與量測
大腦是由數十億個神經細胞 (又稱神經元) 組成,每個神經元平均又有數百至千個連結至其他神經元。這些細胞透過放電的方式傳遞訊號 (動作電位,Action potential),並釋放神經傳導物質刺激下一個神經細胞,繼續傳遞這個訊息。這複雜的神經網路使我們能夠走路、記憶、思考。
而我們所謂的腦電訊號,源於大腦每個神經元的電活動。依據電極的侵入程度和測得訊號的範圍,由內至外部、小至大範圍,大致可分為Intracortical recordings、Electrocorticography (ECoG)、Electroencephalography (EEG) 三種。
1. Intracortical Recordings
如果打開頭骨、穿過腦膜、把電極插入腦中,便可以量測到一個至附近數個神經細胞此起彼落的怒吼 (神經脈衝,Spikes)。若將訊號接到麥克風,即可聽到啪啪啪一個個清晰的神經元放電聲音 (請聽本影片背後像雜訊的聲音 [http://goo.gl/qaGcE5]),亦稱為脈衝序列 (spike train)。
此方法常被神經科學家拿來研究特定腦功能 (如某種視覺刺激反應) 的小神經網路,因為普遍認為脈衝序列含有所有腦活動的資訊,是最直接量測腦部活動的方法 (相較於 ECoG 及 EEG),取得訊號的品質也高。但挑戰有二:第一,侵入式的電極可能會造成腦損傷,所以目前研究皆以昆蟲、老鼠、猴子為主。第二,電極使用不持久,身體對外來物會產生免疫反應或包覆電極。
2, 3. Electrocorticography (ECoG) and Electroencephalography (EEG)
ECoG 和 EEG 的訊號就是我們俗稱的腦波 (更常指後者),兩者的訊號產生原理幾乎相同。神經元活化產生的動作電位,透過軸突 (Axon) 傳遞到突觸 (Synapse,神經細胞連結處) 之後,釋放的神經傳導物質會引發接棒的神經元產生突觸後電位 (post-synaptic potentials, PSPs),進一步刺激或抑制該神經元產生動作電位。如圖二所示,突觸 (Axons 末端) 的 PSPs 使神經元產生不均的電荷分布,導至電荷流動,像是一個電流源 (current source)。當一群神經細胞同步活化,這些小電流源會加總產生夠大的電流訊號,形成相應電磁場,從腦細胞間質、腦膜、腦組織液 (CSF)、頭蓋骨,一層層穿透至頭皮,成為我們量測到的腦波訊號。
雖然腦波也是來自於神經元的電活動,但一般對腦波的成因存在三個誤解:第一,腦波訊號不是來自神經元的動作電位 (Action potential),而是來自突觸後神經元電位 (post-synaptic potentials, PSPs);第二,腦波主要反應出神經元的同步活化,而不是個別神經元活動;第三,腦波被認為只能量測到大腦皮層 (cortex) 的訊號,無法得知皮質下 (subcortical) 腦區的活動。
圖二、ECoG 和EEG訊號產生原理示意圖(圖片修改自8)
ECoG 與 EEG 的差異在於,ECoG 量測會將患者頭蓋骨打開把電極平放在大腦皮層 (Cortex) 上與硬腦膜下 (Subdural) 的半侵入式方法,EEG 則是在頭皮上量測腦波的非侵入式方法。ECoG 好處是減少腦膜、腦組織液、頭蓋骨等介質干擾訊號。EEG 的優勢則是不需手術,便利性和成本都較低。
ECoG 和 EEG 雖然空間準確度不高,但電極可涵蓋整個腦,範圍比 Intracortical recordings (數釐米) 大得多。因此像 ECoG 最常被應用在臨床上協助癲癇 (Epilepsy) 病患定位不規則活動的腦區以利開刀切除。EEG 則被發現與許多認知功能(如專注程度、情緒等)與神經疾病(如自閉症、精神分裂症等)相關。
圖三、Intracortical recordings, ECoG, and EEG示意圖9
總結來說,假想大腦活動是一場棒球比賽,觀眾和球員是神經細胞。Intracortical recordings 就是你周圍的人的聊天內容;ECoG 是棒球場內兩隊觀眾的怒吼;EEG 則是場外混雜著汽機車噪音的聲音。更詳細的原理請參考一篇 2012 年 Nature Reviews Neuroscience 期刊上的文章10。
圖四、各種腦波量測電極與儀器。(a) Intracortical recordings: Utah Array (圖片來源:[http://goo.gl/Enj2PR]) (b) ECoG (圖片來源:[http://goo.gl/tTksxV]) (c)有線EEG: 128-ch Biosemi (圖片來源:[http://goo.gl/oOLX9S]) (d)無線EEG: 64-ch Cognionics (圖片來源:[http://goo.gl/UFKehg])
III. 解譯人腦──腦波訊號的特徵 (Feature Extraction)
取得脈衝序列或腦波訊號之後,接下來很顯然的問題是:「它告訴了我們什麼?」如何從複雜大量的訊號裡提取有用的資訊,進而判讀人的意念,這是腦機介面領域最有挑戰性且最熱門的議題。因篇幅有限,本章只介紹腦波 (EEG, ECoG) 的特徵與分析方法。與 intracortical recordings 相關的方法請參考7。
量測到的腦波是數量龐大的神經元電訊號與各種雜訊的雜合結果,還無法精確地解碼其中的資訊,也還不存在完整的理論解釋腦波訊號及神經網路、腦功能的關係。所以目前腦波分析的方法,仍以數據導向 (Data-driven) 為主。神經科學家、訊號處理專家、統計學家,嘗試各種分析方法,尋找大腦在執行不同任務或處於不同狀態下的腦波特徵。雖然沒辦法解析腦波中全部的資訊,但只要發現一些特徵讓我們能判讀使用者的大腦狀態或意圖,就能允許使用者透過腦機介面與外界簡易的溝通。以下介紹腦機介面常用的腦波特徵1。依照腦波特徵產生的方式,可分為內生性 (endogenous) 和外生性 (exogenous) 兩類。
1. 內生性腦波:自發性產生的腦波特徵
(1) 時域特徵 (Time-domain):直接從原始訊號上直接辨識出的特徵,通常訊號很強且具有特殊波型。例如進入睡眠狀態時出現的 sleep spindle 及 K-complex (圖六(a));或是癲癇 (seizure) 發作時極強且混亂的腦波訊號。附帶一提,因不需任何訊號處理,目前這仍是臨床醫學診斷上最常用的方法。
(2) 頻域特徵 (Frequency-domain):將訊號轉換至頻域 (frequency domain),是最基本也最廣泛使用的訊號分析方法。科學家很早就發現不同頻帶 (frequency band) 的腦波透露了大腦不同的狀態 (圖五)。從亢奮的 β 波,清醒閉眼的 α 波,到淺眠的 θ 和深眠的 δ 波,一般來說腦共振頻率越低代表越處於放鬆休息狀態。
圖五、EEG常見頻帶 (frequency bands) 及代表性的腦狀態11
(3) 事件誘發電位 (Event-related potential, ERP):人受到某些事件刺激後,腦會自發性地產生反應模式,反映了大腦處理事情的途徑與時間。例如受試者要快速判斷螢幕上出現的圖案為目標 (如紅色) 或非目標 (如綠色) 時,出現目標相較於非目標物,頂葉的電極在刺激發生後 300~500 毫秒會記錄到正向 (positivity) 電位,稱為 P300 電位 (圖六(b))。P300 被認為與人做決定的評估過程 (decision evaluation) 反應有關,可用來判讀人的選擇。請見第 V 章,腦撥拼字機和腦控選單。
(4) 動作想像訊號 (Motor imagery):人在規劃動作 (motor planning) 時,動作腦區原本的同步振盪會消失,稱為Event-related de-synchronization(ERD)。參考圖六 (c),想像右手運動(綠線)時,控制右側動作的左腦頂葉會出現 ERD 的負電位 ((c)左圖)。藉由偵測左右腦 ERD 特徵的強弱 (腦波特徵分布圖),即可推知使用者想動左手還是右手,便可簡單地控制輪椅的左或右轉,或是讓機械手臂移動左或右手。
圖六、(a)睡眠狀態的腦波特徵 (圖片來源:wikipedia, http://goo.gl/KbZMsJ)。(b)事件誘發電位 P300 的特徵[1]。(c)動作想像 (motor imagery) 的左右腦 EEG 訊號及腦波特徵 ERD 的分布圖12。
2. 外生性腦波:由外在刺激誘發產生的腦波特徵
視覺刺激誘發電位 (Visual evoked-potential, VEP):若人眼受到固定頻率的刺激 (盯著閃爍的螢幕),人腦枕葉視覺皮質區產生的誘發電位也會有該頻率的訊號。因為VEP訊號強且穩定,是腦機介面中被廣泛使用的特徵 (請見第 V 章,腦波電話)。聽覺、觸覺也被發現有相同現象。
經過上述的介紹,相信讀者對於如何偵測腦波,以及腦波的分類及特徵有了更深的認識。但是如何分析複雜的腦波訊號,並且從中萃取出這些訊號背後的資訊,再將它轉化成為機器指令呢?下一集,腦機介面的進一步應用大解密,請大家持續關注 7/12 日 Investigator 的精彩連載!
- J. R. Wolpaw, N. Birbaumer, D. J. McFarland, G. Pfurtscheller, and T. M. Vaughan, “Brain – computer interfaces for communication and control,” Clin. Nerophysiology, vol. 113, pp. 767–791, 2002.
- B. Allison, “Trends in BCI research,” XRDS Crossroads, ACM Mag. Students, vol. 18, no. 1, p. 18, Sep. 2011.
- J. J. Vidal, “Real-time detection of brain events in EEG,” Proc. IEEE, vol. 65, no. 5, pp. 633–641, May 1977.
- J. J. Vidal, “Toward direct brain-computer communication.,” Annu. Rev. Biophys. Bioeng., vol. 2, pp. 157–80, Jan. 1973.
- E. M. Maynard, C. T. Nordhausen, and R. A. Normann, “The Utah Intracortical Electrode Array: A recording structure for potential brain-computer interfaces,” Electroencephalogr. Clin. Neurophysiol., vol. 102, no. 3, pp. 228–239, Mar. 1997.
- J. Wessberg, C. R. Stambaugh, J. D. Kralik, P. D. Beck, M. Laubach, J. K. Chapin, J. Kim, S. J. Biggs, M. A. Srinivasan, and M. A. Nicolelis, “Real-time prediction of hand trajectory by ensembles of cortical neurons in primates.,” Nature, vol. 408, no. 6810, pp. 361–5, Nov. 2000.
- M. Nicolelis, “Beyond Boundaries: The New Neuroscience of Connecting Brains with Machines—and How It Will Change Our Lives,” 2012.
- E. Kandel, J. Schwartz, and T. Jessell, Principles of neural science. 2000.
- N. Thakor, “Building Brain Machine Interfaces – Neuroprosthetic Control with Electrocorticographic Signals,” IEEE Life Sciences, 2012.
- G. Buzsáki, C. A. Anastassiou, and C. Koch, “The origin of extracellular fields and currents–EEG, ECoG, LFP and spikes.,” Nat. Rev. Neurosci., vol. 13, no. 6, pp. 407–20, Jun. 2012.
- T. Budzynski, H. Budzynski, J. Evans, and A. Abarbanel, Introduction to quantitative EEG and neurofeedback: Advanced theory and applications. 2009.
- B. Blankertz, R. Tomioka, S. Lemm, M. Kawanabe, and K. Muller, “Optimizing Spatial filters for Robust EEG Single-Trial Analysis,” IEEE Signal Process. Mag., vol. 25, no. 1, pp. 41–56, 2008.
作者簡介
徐聖修 Sheng-Hsiou (Shawn) Hsu
Email: shh078@ucsd.edu
台大電機系畢,現於美國加州大學聖地牙哥分校 (UCSD) 就讀生物工程系 (Bioengineering) 博士班。喜愛以工程技術,一探大腦的奧秘。目前正在Swartz Center for Computational Neuroscience (SCCN) 研究腦波 (EEG) 的分析方法以及開發腦機介面 (Brain-computer interface) 的應用。
撰稿|徐聖修
編輯|陳致曄、黃翊柔
學術部負責人|黃翊柔
[…] 2. 腦機介面 (Brain-Computer Interface) 專題(上) […]
[…] 腦機介面 (Brain-Computer Interface) 專題 (上) […]