科技日報(bào)記者?張佳欣
想象一下,如果人工智能(AI)能讀出人腦中正在想的事,你敢信嗎?
向研究對象展示的豹子圖像(左)以及通過生成式AI利用大腦活動重建的圖像(右)。
圖片來源:日本量子科學(xué)技術(shù)研究所
本月在線發(fā)表在國際科學(xué)雜志《神經(jīng)網(wǎng)絡(luò)》上的一項(xiàng)研究顯示,日本科學(xué)家利用AI技術(shù),成功地根據(jù)人腦活動創(chuàng)建了世界上第一幅物體和風(fēng)景的心理圖像。這項(xiàng)被稱為“大腦解碼”的技術(shù)可以根據(jù)大腦活動將感知內(nèi)容可視化,有望應(yīng)用于醫(yī)療和福利領(lǐng)域。
在腦機(jī)接口和神經(jīng)工程快速發(fā)展的今天,通過分析大腦活動,用機(jī)器讀出志愿者大腦中所想的內(nèi)容或者畫面已經(jīng)不再是科幻故事。解碼思想的技術(shù)日趨成熟,AI“讀心術(shù)”的設(shè)想越來越接近現(xiàn)實(shí)。與此同時(shí),這也引發(fā)了人們對隱私的憂慮。
復(fù)制心理意象
先前的研究表明,根據(jù)功能磁共振成像(fMRI)測量的大腦活動可重建人類看到的圖像。但這僅限于特定內(nèi)容,例如字母、人臉等。
基于之前的方法,日本量子科學(xué)技術(shù)研究所(QST)和大阪大學(xué)科學(xué)家團(tuán)隊(duì)開發(fā)了一種技術(shù),可量化大腦活動,并將生成式AI和預(yù)測技術(shù)結(jié)合來繪制圖像,以重建復(fù)雜的物體。
研究人員向參與者展示了大約1200張物體和風(fēng)景圖像,并使用fMRI分析和量化了他們的大腦信號和視覺刺激之間的關(guān)系,然后將這些圖像用于訓(xùn)練生成式AI,以破譯和復(fù)制來自大腦活動的心理意象。結(jié)果,研究人員利用這種方法產(chǎn)生了生動的圖像,例如具有耳朵、嘴巴和斑點(diǎn)等可辨別特征的豹子,以及帶有紅色翼燈的飛機(jī)等物體。
研究人員表示,將心理圖像可視化為任意的自然圖像是一個(gè)重要的里程碑。
QST研究人員稱,人類已使用顯微鏡和其他設(shè)備來觀察肉眼看不見的世界,但還無法看到一個(gè)人的內(nèi)心世界,這是人類第一次窺視另一個(gè)人頭腦中的思想。從本質(zhì)上講,它可用來幫助創(chuàng)建新的通信設(shè)備,同時(shí)還可讓科學(xué)家探索和理解幻覺與夢境如何在大腦中發(fā)揮作用。
解碼語言數(shù)據(jù)
《自然·神經(jīng)科學(xué)》雜志今年稍早時(shí)間發(fā)表了一項(xiàng)新研究。美國得克薩斯大學(xué)奧斯汀分校研究團(tuán)隊(duì)在大型語言模型的助力下,開發(fā)出一款現(xiàn)代“讀心機(jī)”。他們利用fMRI收集了3名參與者的大腦活動信息,并將思維轉(zhuǎn)化為了語言文字,準(zhǔn)確率達(dá)到82%。
fMRI掃描的血氧水平依賴性信號顯示了大腦不同部位的血流量和氧合水平的變化。通過關(guān)注處理語言的大腦區(qū)域和網(wǎng)絡(luò)的活動模式,研究人員發(fā)現(xiàn)他們的解碼器可被訓(xùn)練來重建連續(xù)語言,包括一些特定的單詞和句子的一般含義。
具體而言,解碼器獲取了3名參與者聽故事時(shí)的大腦反應(yīng),并生成了可能產(chǎn)生這些大腦反應(yīng)的單詞序列。這些單詞序列很好地捕捉了故事的大意,甚至還包括準(zhǔn)確的單詞和短語。研究人員還讓參與者觀看無聲電影并在掃描大腦時(shí)想象電影情節(jié)。在這兩種情況下,解碼器通常都能成功預(yù)測故事和情節(jié)的要點(diǎn)。例如,一位用戶認(rèn)為“我還沒有駕照”,解碼器預(yù)測“她還沒開始學(xué)開車”。此外,當(dāng)參與者主動聆聽一個(gè)故事而忽略同時(shí)播放的另一個(gè)故事時(shí),解碼器可識別正在主動聆聽的故事的含義。
讀腦技術(shù)引擔(dān)憂
能夠“讀心”的技術(shù)理念引發(fā)了人們對心理隱私的擔(dān)憂。西班牙格拉納達(dá)大學(xué)生物倫理學(xué)教授戴維·羅德里格斯·阿里亞斯·韋爾恩警告,這更接近機(jī)器“能夠讀懂思想并轉(zhuǎn)錄思想”的未來,但其可能會違背人們的意愿。
美國醫(yī)療新聞網(wǎng)站statnews針對得克薩斯大學(xué)奧斯汀分校的研究發(fā)表評論稱,人們通常將這類大腦解碼器描述為“讀心機(jī)”,但這是一個(gè)模糊的術(shù)語,夸大了它們的能力。雖然人們的大腦產(chǎn)生了心理過程,但人們對大多數(shù)心理過程在大腦活動中究竟是如何編碼的了解有限。
文章認(rèn)為,大腦解碼器不能簡單地讀出一個(gè)人的思想內(nèi)容。相反,它們學(xué)會的是對心理內(nèi)容作出預(yù)測。大腦解碼器就像是解釋大腦活動模式和精神內(nèi)容描述之間的一本詞典。然而,大腦活動會受到直接刺激以外的因素的影響,因此“詞典”只能預(yù)測一個(gè)人的大腦將如何對刺激作出反應(yīng)。此外,衡量一個(gè)人的大腦對每一種可能的刺激的反應(yīng)是不可行的。預(yù)測過程天生就不完美,所以解碼器對一個(gè)人的想法的預(yù)測,可能與這個(gè)人的實(shí)際想法有很大出入。
此外,文章強(qiáng)調(diào),大腦解碼器只能“復(fù)制”活躍的精神內(nèi)容。所有的大腦記錄方法都會測量與人正在積極處理信息時(shí)相對應(yīng)的信號。相比之下,不活躍的信息,如長期記憶,是在神經(jīng)元之間的連接中編碼的,人們距離能夠測量和解碼這些信息還很遠(yuǎn)。