原標(biāo)題:機(jī)器學(xué)習(xí)實(shí)現(xiàn)了腦機(jī)語(yǔ)言翻譯,那距離“意念交流”還有多遠(yuǎn)?
在《三體》當(dāng)中,大劉為三體文明設(shè)計(jì)了一種“思考即說(shuō)話”的意念交流方式。在嚴(yán)酷的三體環(huán)境下,三體人正是依靠這種高效無(wú)誤的意念交流方式,實(shí)現(xiàn)了知識(shí)的無(wú)障礙共享、理性決策的高度統(tǒng)一,才能創(chuàng)造出如此高度發(fā)達(dá)的文明成果和整齊劃一的社會(huì)體制。
這一思路就如同去中心化的分布式計(jì)算機(jī),只要建立聯(lián)接,每一臺(tái)獨(dú)立的計(jì)算機(jī)單元都可以獲知其他計(jì)算機(jī)單元的數(shù)據(jù),每一臺(tái)計(jì)算機(jī)單元理論上也都能夠共享共同的執(zhí)行命令。
反觀人類,我們就顯得有些“低能”了。首先,我們每個(gè)人的大腦都像是一塊白板,任何的數(shù)據(jù)信息都需要經(jīng)過(guò)大腦的發(fā)育和長(zhǎng)期的經(jīng)驗(yàn)訓(xùn)練才可能學(xué)到一星半點(diǎn)的知識(shí);其次,我們的大腦又仿佛一個(gè)神秘黑箱,每個(gè)人都只能通過(guò)外在的語(yǔ)言、表情、姿態(tài)等信號(hào)來(lái)識(shí)別對(duì)方的動(dòng)機(jī),所謂知人知面不知心就是這個(gè)意思。再次,我們的數(shù)據(jù)信號(hào)的輸出又非常低效,我們只能以這種每秒鐘幾KB的語(yǔ)音、詞匯等信息來(lái)輸出想法,嚴(yán)重制約了溝通效率。
可能有人會(huì)質(zhì)疑,我們有必要向三體人那樣通過(guò)“意念”直接交流嗎?假如有一天我們的思想真的可以直接交流,即便有那么多的好處,同樣那些個(gè)人的貪念、惡意也無(wú)法隱瞞,這些對(duì)我們?nèi)祟悂?lái)說(shuō)都可能是一場(chǎng)巨大災(zāi)難。
在高等文明來(lái)臨前,私欲和惡意就會(huì)將人類推進(jìn)深淵。不過(guò),這種推論仍然是杞人憂天。
一方面目前這種程度的“腦機(jī)接口”技術(shù)的實(shí)現(xiàn)還遙遙無(wú)期;另一方面,一旦人類動(dòng)了“意念交流”的念頭,只要技術(shù)有任何可能的突破,好奇心都會(huì)驅(qū)使那些最聰明的人去實(shí)現(xiàn)它。至于技術(shù)出來(lái)是否“洪水滔天”,那就事后再說(shuō)了。
當(dāng)前來(lái)看,腦機(jī)接口技術(shù)正在取得一些顯著的進(jìn)展。最近一項(xiàng)可以稱之為腦機(jī)語(yǔ)言翻譯的技術(shù),又實(shí)現(xiàn)了新的突破。
3月底,在Nature雜志的副刊《神經(jīng)科學(xué)》上面,來(lái)自美國(guó)加州大學(xué)舊金山分校的研究人員發(fā)表了一項(xiàng)新的研究,他們利用機(jī)器學(xué)習(xí)的方法,可以把腦電波信號(hào)直接翻譯成了有意義的語(yǔ)音和文字,翻譯準(zhǔn)確度得到大幅提高,最低錯(cuò)誤率只有3%。
這一結(jié)果是如何實(shí)現(xiàn)的,這一研究意味著什么,距離實(shí)現(xiàn)“意念交流”還有多遠(yuǎn)?這些正是我們接下來(lái)要討論的內(nèi)容。
人腦語(yǔ)言翻譯規(guī)律,機(jī)器學(xué)習(xí)很有一套
我們先來(lái)還原一下這項(xiàng)實(shí)驗(yàn)的過(guò)程:研究人員找到四名患有癲癇的受試者,事先在其大腦的控制發(fā)音的腦區(qū)植入電極裝置。在實(shí)驗(yàn)中,受試者需要先在一個(gè)有限的詞語(yǔ)庫(kù)里,反復(fù)地朗讀一些句子。電極裝置就可以在過(guò)程中捕捉朗讀瞬間活躍的腦電波信號(hào)。
(記錄大腦活動(dòng)的顱內(nèi)ECoG電極陣列)
然后,研究人員就可以在在收集到的信號(hào)和語(yǔ)句庫(kù)之間找規(guī)律,把跟控制發(fā)聲動(dòng)作相關(guān)的腦電波信息提取出來(lái)。接著就可以通過(guò)機(jī)器學(xué)習(xí)對(duì)這些數(shù)據(jù)進(jìn)行訓(xùn)練,使得AI可以在腦電波信號(hào)和語(yǔ)句庫(kù)之間建立起映射關(guān)系的模型。
最后,你只要在大腦中想象自己說(shuō)出詞語(yǔ)庫(kù)內(nèi)的某一句話,AI程序就可以根據(jù)訓(xùn)練后的映射關(guān)系,來(lái)識(shí)別你的內(nèi)心獨(dú)白了。
(通過(guò)聲波動(dòng)作的腦電波信號(hào)識(shí)別語(yǔ)音)
由此可知,實(shí)驗(yàn)得以成功的前提就是復(fù)雜的腦電波信號(hào)和明確的語(yǔ)詞之間,可以建立一套準(zhǔn)確的映射關(guān)系。那么基于數(shù)據(jù)標(biāo)記的有監(jiān)督的機(jī)器學(xué)習(xí)就很容易在訓(xùn)練中“找到規(guī)律”。
論文中還表明,AI在學(xué)習(xí)識(shí)別人類腦電波的速度非??臁?shí)驗(yàn)結(jié)果顯示,只要經(jīng)過(guò)大概40分鐘語(yǔ)音數(shù)據(jù)的簡(jiǎn)單訓(xùn)練,語(yǔ)音相關(guān)的腦電波的AI翻譯,就可以達(dá)到比較高的準(zhǔn)確率了。其中效果最好的一名受試者,在僅僅經(jīng)過(guò)9次數(shù)據(jù)訓(xùn)練之后,詞錯(cuò)率就降到只有3%了。這個(gè)詞錯(cuò)率已經(jīng)接近于迄今為止AI讀取人的想法的最佳表現(xiàn)。研究人員認(rèn)為,如果再經(jīng)過(guò)更多的訓(xùn)練,識(shí)別的效果還會(huì)進(jìn)一步上升。
當(dāng)然,這套映射規(guī)則是限定語(yǔ)種、限定語(yǔ)句庫(kù)和限定測(cè)試者的基礎(chǔ)上完成的。
首先,在這次的研究中所使用的語(yǔ)句庫(kù),只包含100多個(gè)詞匯,50-60個(gè)句子,比我們?nèi)粘=涣鞯恼Z(yǔ)句庫(kù)少很多。
其次,腦電波的識(shí)別是在同一個(gè)人的人腦中完成的,也就是還不能證明,不同人之間,腦電波信號(hào)的識(shí)別規(guī)律是否具有遷移性。
很顯然同樣的一句話,受到不同語(yǔ)言背景、不同理解能力,甚至更為復(fù)雜的生理因素的影響,在不同的人腦中,形成的腦電波可能是完全不同的。
這可能就需要針對(duì)每個(gè)人的腦電波信號(hào)的特點(diǎn),分別建立完全不同的AI識(shí)別模型。這也意味著大腦信號(hào)之間的直接交流幾乎很難實(shí)現(xiàn),仍然需要具有公共涵義的共同語(yǔ)言作為中介來(lái)實(shí)現(xiàn)思想的交流。這也是哲學(xué)家維特根斯坦提出的“沒(méi)有私人語(yǔ)言”的一種現(xiàn)實(shí)困境吧。
那么,如果AI對(duì)于腦電波的文本翻譯能夠達(dá)到實(shí)際應(yīng)用的程度,這項(xiàng)技術(shù)對(duì)于我們意味著什么呢?
讓失語(yǔ)者重新“說(shuō)話”,腦機(jī)語(yǔ)言翻譯大有作為
我們先來(lái)理解下這項(xiàng)腦機(jī)語(yǔ)言翻譯的真正意義。在人類的漫長(zhǎng)進(jìn)化史中,大腦的復(fù)雜和語(yǔ)言的出現(xiàn)成為一對(duì)互為因果的因素,幫助人類從嚴(yán)酷的自然環(huán)境中勝出,建立起復(fù)雜的文明和文化形態(tài)。也就是從人之為人的數(shù)萬(wàn)年時(shí)間里,我們?nèi)祟惖淖钪饕换シ绞骄褪钦Z(yǔ)言,以及在語(yǔ)言基礎(chǔ)上衍生出的文字、信號(hào)等溝通方式。
而這次腦機(jī)語(yǔ)言翻譯的出現(xiàn),意味著人類的交互方式出現(xiàn)了新的形式,也就是由大腦信號(hào)直接轉(zhuǎn)化為語(yǔ)言信號(hào)。盡管如我們所說(shuō),這一方式離三體人的“意念交流”還有很大距離,但已經(jīng)是在向這一“意念交流”的方向前進(jìn)了一大步。
至于現(xiàn)實(shí)意義呢?對(duì)于普通人而言,無(wú)論是誰(shuí)也不會(huì)輕易嘗試在大腦中植入一塊電極裝置,再是日常語(yǔ)言交流仍然是最廉價(jià)、最高效地表達(dá)信息的方式。短期內(nèi),我們還是會(huì)習(xí)慣語(yǔ)音和手指作為信息輸入的主要手段。
那么,這項(xiàng)技術(shù)最靠譜的實(shí)際應(yīng)用場(chǎng)景就是針對(duì)那些失去語(yǔ)言能力或?qū)懽帜芰Φ幕疾∪巳毫恕J聦?shí)上研究者的出發(fā)點(diǎn)正是幫助因?yàn)橹酗L(fēng)偏癱、漸凍癥或者其他因神經(jīng)系統(tǒng)疾病而喪失語(yǔ)言功能和溝通能力的人們,恢復(fù)語(yǔ)言溝通能力。而AI腦機(jī)語(yǔ)言翻譯,就成為他們重新獲得與世界溝通的工具。
(腦控打字)
在這項(xiàng)技術(shù)實(shí)現(xiàn)之前,幫助失語(yǔ)者溝通的主要腦機(jī)接口技術(shù)就是“腦控打字”,也就是通過(guò)采集腦信號(hào),控制光標(biāo)選擇字母,然后組成單詞后輸出。這個(gè)領(lǐng)域做到最好效果的Facebook也只能做到每分鐘最多打8個(gè)單詞。
在腦控打字難以突破效率難關(guān)的情況下,AI腦機(jī)語(yǔ)言翻譯可以直接完成腦電波信號(hào)到語(yǔ)言轉(zhuǎn)化,效率一下子提高到了正常人的語(yǔ)速水平。這讓失語(yǔ)者進(jìn)行語(yǔ)言輸出產(chǎn)生了飛躍的進(jìn)步。
但現(xiàn)實(shí)問(wèn)題仍然存在,因?yàn)檫@些測(cè)試者都是可以正常說(shuō)話的,那么從他們身上采集數(shù)據(jù)訓(xùn)練而成的AI算法,是否可以應(yīng)用到中風(fēng)病人或者漸凍人身上呢?
正如我們上面所述,每個(gè)人的腦電波的信號(hào)采集可能存在一些差異,那么AI算法可能會(huì)因人而異,因此很難進(jìn)行不同人之間的遷移。
那么就目前來(lái)說(shuō),只能是在有中風(fēng)或漸凍癥發(fā)作前或嚴(yán)重前,提前采集他們的腦電波信號(hào),形成專屬的AI翻譯模型,才可能真正幫助患者。
腦機(jī)語(yǔ)言翻譯都來(lái)了,那“意念交流”還有多遠(yuǎn)?
相較于我們習(xí)以為常的AI語(yǔ)音識(shí)別技術(shù),AI腦機(jī)語(yǔ)言翻譯看起來(lái)就已經(jīng)非常令人驚嘆了,那么要是達(dá)到用“意念交流”的腦腦交互的水平,那就有點(diǎn)天方夜譚的感覺(jué)了。
所謂的腦腦交互,那就是不再借助語(yǔ)言而直接依靠腦電波信號(hào)進(jìn)行人際之間的溝通。這種就類似于三體人的思想共享,《阿凡達(dá)》里的人獸聯(lián)機(jī)的技術(shù)。
一般來(lái)說(shuō),我們通過(guò)語(yǔ)言傳輸大腦信息,必然就存在著信息缺失、傳輸損耗以及效率低下的問(wèn)題。翻譯成人話就是,我們經(jīng)常詞不達(dá)意、左耳朵進(jìn)右耳朵出,寫篇文章好幾天,聊個(gè)天就大半天過(guò)去。
腦腦交互則可以大幅提升人們之間交流的速度和信息量,能夠保留和傳輸真實(shí)無(wú)損的大腦信息,避免誤會(huì),從而根本改變?nèi)祟惖膮f(xié)作方式。
腦腦交互并非完全的空想,現(xiàn)在也有一些基礎(chǔ)的實(shí)驗(yàn)證實(shí)了這一可能性。比如2018年華盛頓大學(xué),通過(guò)以下實(shí)驗(yàn),讓三個(gè)相互隔離的人帶上了腦電圖頭盔這種非侵入式腦機(jī)設(shè)備,純靠看和想,共同協(xié)作,來(lái)完成俄羅斯方塊游戲。其中2個(gè)人負(fù)責(zé)觀察底部情況和下落的方塊形狀,操控手柄的人則完全不知道狀況,只能讓這兩個(gè)人產(chǎn)生腦電波信號(hào),通過(guò)一種叫TMS的磁刺激方式來(lái)傳遞信息給操控者的大腦,讓其大腦產(chǎn)生操作的指令。
經(jīng)過(guò)5組不同的實(shí)驗(yàn)中,這種腦腦交互傳達(dá)信息的準(zhǔn)確率達(dá)到了81.25%。雖然還遠(yuǎn)遠(yuǎn)達(dá)不到人類之間傳輸信息需要的準(zhǔn)確率和復(fù)雜度,但是這一實(shí)驗(yàn)帶來(lái)腦腦交互的一種可能性。
但是可能性并不意味著現(xiàn)實(shí)性。這一點(diǎn)可能性之后仍然要面對(duì)大腦這個(gè)神秘黑箱制造的無(wú)盡難題。
(大腦皮層的語(yǔ)言分區(qū))
目前,神經(jīng)科學(xué)家已經(jīng)知道人類的認(rèn)知功能跟大腦的分區(qū)有關(guān)。研究人員可以通過(guò)對(duì)大腦神經(jīng)活動(dòng)的空間和時(shí)間信號(hào)進(jìn)行高分辨率的數(shù)據(jù)采集,并配合機(jī)器學(xué)習(xí)算法將各種感知覺(jué)、運(yùn)動(dòng)、語(yǔ)言等高級(jí)認(rèn)知功能所對(duì)應(yīng)的神經(jīng)信號(hào)互相分離出來(lái)。然后,可以實(shí)現(xiàn)像一些基本的腦機(jī)語(yǔ)言翻譯這樣的功能。
但是真正實(shí)現(xiàn)語(yǔ)言的解碼翻譯其實(shí)還要面臨眾多的困難。除了上面提到的聲波信號(hào)對(duì)于每個(gè)人的腦區(qū)的刺激會(huì)因人而異之外,由于世界上有上萬(wàn)種的語(yǔ)言及方言,同一個(gè)語(yǔ)義在不同語(yǔ)言和方言下可能對(duì)應(yīng)著不同的腦電波信號(hào)。甚至于不同年齡、不同成長(zhǎng)環(huán)境,不同的情緒狀態(tài)都有可能導(dǎo)致完全不同的腦電波信號(hào)。
此外,我們閱讀文字也可以引發(fā)語(yǔ)言相關(guān)的腦電波活動(dòng),這肯定與語(yǔ)音刺激的反應(yīng)又不相同。同樣,不同的文字形態(tài)又會(huì)帶來(lái)不同的腦電波信號(hào)模式。
也就是實(shí)驗(yàn)室狀態(tài)下的無(wú)干擾的測(cè)試結(jié)果,極難應(yīng)用到現(xiàn)實(shí)場(chǎng)景當(dāng)中。要實(shí)現(xiàn)如此多復(fù)雜的腦電波語(yǔ)言翻譯,其難度可能比全世界統(tǒng)一語(yǔ)言和文字的難度還大。那么想要實(shí)現(xiàn)后者,你們認(rèn)為其可能性有多大呢?
那么,對(duì)于腦腦交互呢?我們是否可以先繞開(kāi)語(yǔ)言翻譯的這座大山,先去實(shí)現(xiàn)一些非語(yǔ)言化或者先于語(yǔ)言化的腦信號(hào)交互呢?比如,找到人類共同的一些辨識(shí)方向、情緒以及一些本能應(yīng)激反應(yīng)的腦電波信號(hào),通過(guò)AI學(xué)習(xí),實(shí)現(xiàn)信號(hào)的解碼和共享。
這確實(shí)是有可能的,比如上面俄羅斯方塊游戲的方向測(cè)試,以及在一些大鼠身上做的一些頭部預(yù)期運(yùn)動(dòng)的信號(hào)的測(cè)試。但是,再?gòu)?fù)雜一些,就可能會(huì)必須要從腦電波信號(hào)轉(zhuǎn)碼為語(yǔ)言(語(yǔ)音或文字)來(lái)進(jìn)行交互了,不然,這些探測(cè)到的腦電波數(shù)據(jù)就僅僅是一些物理信號(hào),而不能具有任何的信息價(jià)值。
這可能還是應(yīng)了那個(gè)哲學(xué)命題,如果意識(shí)不通過(guò)語(yǔ)言來(lái)表達(dá),我們?cè)趺匆庾R(shí)到這個(gè)意識(shí)呢?
在一個(gè)需要靠講故事來(lái)?yè)问兄档男滦彤a(chǎn)業(yè),腦機(jī)語(yǔ)言翻譯的實(shí)現(xiàn),確實(shí)再一次給腦機(jī)接口的技術(shù)發(fā)展和商業(yè)化注入了一劑強(qiáng)心針。當(dāng)然,我們也要冷靜地看到這一技術(shù)仍然只具有“實(shí)驗(yàn)室”的成功價(jià)值,其用于商業(yè)化方面還需要腦機(jī)接入的材料成本、安全性,信號(hào)檢測(cè)的準(zhǔn)確度,翻譯模型的遷移性和普適性等各個(gè)方面走向成熟。
至于我們?cè)噲D去回答的“意念交流”的腦腦交互,大家其實(shí)也看到了,前途茫茫,困難依舊重重,甚至還有一座語(yǔ)言的大山橫亙?cè)谌祟惷媲啊?/p>
畢竟,上帝也是靠“說(shuō)”才創(chuàng)造了世界,而不是靠“想”創(chuàng)造的世界。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。