AI學(xué)語(yǔ)言與人腦極為相似!新研究證明:語(yǔ)言并非人類(lèi)與生特有的能力,機(jī)器也能學(xué)
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
人工神經(jīng)網(wǎng)絡(luò)(ANN)的學(xué)習(xí)方式,竟然與人腦極為相似!
你沒(méi)聽(tīng)錯(cuò),至少在處理語(yǔ)言這塊上,機(jī)器似乎更像人了。
先看下面這張圖:
圖片
藍(lán)色代表的是人的腦電波信號(hào),紅色代表的是人工神經(jīng)網(wǎng)絡(luò)信號(hào)。
而這是人腦和機(jī)器聽(tīng)同一個(gè)語(yǔ)音時(shí)所作出的反應(yīng)。
是不是非常相似,有木有被驚到?
實(shí)際上這張圖來(lái)源于最近的一項(xiàng)研究,相關(guān)論文已被發(fā)表在了Nature子刊Scientific reports上。
圖片
而此前,關(guān)于人的大腦以及機(jī)器的大腦是如何進(jìn)行學(xué)習(xí)的問(wèn)題,始終是一個(gè)謎。
“神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方式是否與人類(lèi)相同”這個(gè)話題,也一直存在爭(zhēng)議。
所以到底有什么證據(jù)可以證明,人類(lèi)和機(jī)器“很可能是以類(lèi)似的方式處理語(yǔ)言”?
人工神經(jīng)網(wǎng)絡(luò)信號(hào)與人腦電波信號(hào)非常匹配
為了揭開(kāi)人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的神秘面紗,加州大學(xué)伯克利分校的計(jì)算語(yǔ)言學(xué)家Ga?per Begu?與約翰霍普金斯大學(xué)的博士生Alan Zhou、華盛頓大學(xué)神經(jīng)科學(xué)家Christina Zhao進(jìn)行了這項(xiàng)研究。
在這項(xiàng)研究中,他們給人類(lèi)聽(tīng)一種簡(jiǎn)單的聲音,然后收集人類(lèi)聽(tīng)到聲音后產(chǎn)生的腦電波。同時(shí),將同一種聲音輸入到神經(jīng)網(wǎng)絡(luò)中,分析神經(jīng)網(wǎng)絡(luò)所產(chǎn)生的信號(hào)。
對(duì)兩者進(jìn)行比較,結(jié)果竟然出奇相似。
最重要的是,研究人員測(cè)試了適用于各種任務(wù)的通用神經(jīng)元組成的網(wǎng)絡(luò),即使是非常通用的網(wǎng)絡(luò)(對(duì)語(yǔ)音或其它聲音沒(méi)有偏見(jiàn)),仍然展現(xiàn)出與人類(lèi)神經(jīng)編碼的對(duì)應(yīng)關(guān)系。
那這項(xiàng)研究具體是怎樣進(jìn)行的呢?
首先,為了更好地對(duì)比人類(lèi)大腦與人工神經(jīng)網(wǎng)絡(luò)的反應(yīng)情況,研究人員分別找來(lái)了14名說(shuō)英語(yǔ)的人和15名說(shuō)西班牙語(yǔ)的人。
然后對(duì)這些人播放了一個(gè)單音節(jié)音頻——“bah”,每次播放8分鐘,重復(fù)兩次。
在播放的過(guò)程中,研究人員記錄了每個(gè)聽(tīng)眾腦干中神經(jīng)元平均電活動(dòng)的波動(dòng)情況(腦干是大腦中最先處理聲音的部分)。
另外,研究人員將相同的“bah”聲音輸入到兩組不同的神經(jīng)網(wǎng)絡(luò)中。其中一組神經(jīng)網(wǎng)絡(luò)是經(jīng)過(guò)英語(yǔ)訓(xùn)練的,另一組是經(jīng)過(guò)西班牙語(yǔ)訓(xùn)練的。
研究人員選擇的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是生成式對(duì)抗網(wǎng)絡(luò)(GAN)。
GAN最早在2014年被提出,用于生成圖像。GAN由兩個(gè)模塊組成,分別是判別器(discriminator)和生成器(generator),它們之間相互博弈學(xué)習(xí),可以產(chǎn)生更好的輸出。
具體來(lái)說(shuō),生成器創(chuàng)建一個(gè)圖像或聲音的樣本,判別器確定它與訓(xùn)練樣本的接近程度并提供反饋,導(dǎo)致生成器再次反應(yīng),如此循環(huán),直到GAN能夠輸出期望的結(jié)果。
圖片
而在這項(xiàng)研究中,判別器最初是在一系列英語(yǔ)或西班牙語(yǔ)的聲音上進(jìn)行訓(xùn)練的。
然后,從未接受過(guò)這些聲音訓(xùn)練的生成器必須找到一種產(chǎn)生它們的方法。它開(kāi)始制造隨機(jī)的聲音,經(jīng)過(guò)約40,000次與判別器的交互后,生成器逐漸產(chǎn)生了正確的聲音。經(jīng)過(guò)這種訓(xùn)練,判別器也變得更善于區(qū)分真實(shí)聲音以及生成的聲音。
在判別器經(jīng)過(guò)訓(xùn)練之后,研究人員就開(kāi)始播放“bah”的聲音。它們測(cè)量了判別器人工神經(jīng)元的平均活動(dòng)水平的波動(dòng),記錄了神經(jīng)網(wǎng)絡(luò)的處理活動(dòng),重點(diǎn)關(guān)注了網(wǎng)絡(luò)中用于分析聲音的人工神經(jīng)元層(以模擬腦干讀數(shù))。
將采集到的人腦電波信號(hào)與人工神經(jīng)網(wǎng)絡(luò)信號(hào)進(jìn)行比較,結(jié)果見(jiàn)下圖:
△使用英語(yǔ)的實(shí)驗(yàn)結(jié)果:藍(lán)色是人腦電波,紅色是人工神經(jīng)網(wǎng)絡(luò)信號(hào)
△使用西班牙語(yǔ)的實(shí)驗(yàn)結(jié)果:藍(lán)色是人腦電波,紅色是人工神經(jīng)網(wǎng)絡(luò)信號(hào)
可以發(fā)現(xiàn),這些人工神經(jīng)網(wǎng)絡(luò)信號(hào)與人腦電波信號(hào)非常匹配!
這也就說(shuō)明了這兩個(gè)系統(tǒng)正在進(jìn)行類(lèi)似的活動(dòng)。
此外,這項(xiàng)實(shí)驗(yàn)還揭示了人類(lèi)和機(jī)器之間的另一個(gè)有趣的相似之處。腦電波顯示,說(shuō)英語(yǔ)和說(shuō)西班牙語(yǔ)的測(cè)試者對(duì)“bah”聲音有不同的聽(tīng)覺(jué)感知(說(shuō)西班牙語(yǔ)的人更多地聽(tīng)到了“pah”的聲音)。
而GAN的信號(hào)也顯示出了:接受英語(yǔ)訓(xùn)練的網(wǎng)絡(luò)在處理聲音時(shí),與接受西班牙語(yǔ)訓(xùn)練的網(wǎng)絡(luò)有些不同。
“而這些差異是朝著同一個(gè)方向產(chǎn)生的,”Begu?解釋道。
說(shuō)英語(yǔ)的人的腦干對(duì)“bah”聲音的反應(yīng)比說(shuō)西班牙語(yǔ)的人稍微早一些,而受過(guò)英語(yǔ)訓(xùn)練的GAN對(duì)相同的聲音的反應(yīng)也比受過(guò)西班牙語(yǔ)訓(xùn)練的模型稍微早一些。
人類(lèi)與機(jī)器的這種反應(yīng)時(shí)間上的差異幾乎是相同的,大約是千分之一秒。
這也為Begu?提供了額外的證據(jù),即人類(lèi)和人工網(wǎng)絡(luò)“很可能是以類(lèi)似的方式處理語(yǔ)言。”
喬姆斯基錯(cuò)了?
這項(xiàng)研究的結(jié)論,實(shí)際上與上世紀(jì)50年代語(yǔ)言學(xué)家喬姆斯基(Noam Chomsky)提出的“人類(lèi)天生就具有理解語(yǔ)言的能力,這種能力與人腦是硬連接(hard-wired)”的觀點(diǎn)相違背。
此外,喬姆斯基還提出了普遍語(yǔ)法(Universal Grammar)概念,即人腦普遍有一種語(yǔ)言習(xí)得機(jī)制,使人們能夠?qū)W會(huì)使用語(yǔ)言。
難道,喬姆斯基的觀點(diǎn)是錯(cuò)誤的?
對(duì)此,有網(wǎng)友表示:
ChatGPT已經(jīng)證明了學(xué)習(xí)語(yǔ)言以及理解語(yǔ)言并不需要語(yǔ)法。
圖片
也有網(wǎng)友保持懷疑態(tài)度:
人腦和神經(jīng)網(wǎng)絡(luò)并不是一回事,我們應(yīng)該對(duì)通過(guò)研究神經(jīng)網(wǎng)絡(luò)的計(jì)算時(shí)間來(lái)研究人腦保持懷疑。
此外,該神經(jīng)網(wǎng)絡(luò)已經(jīng)用人類(lèi)語(yǔ)言進(jìn)行了訓(xùn)練,所以這個(gè)說(shuō)法也不能從觀察到的時(shí)間推斷出來(lái)。
Begu?則表示:這場(chǎng)辯論尚未結(jié)束。
他表示自己還將進(jìn)一步探索人腦和神經(jīng)網(wǎng)絡(luò)之間的相似之處,例如,他正在測(cè)試大腦皮層發(fā)出的腦電波(在腦干完成其部分聽(tīng)覺(jué)處理后)是否與GAN更深層產(chǎn)生的信號(hào)相對(duì)應(yīng)。
他們希望最終能夠開(kāi)發(fā)一個(gè)可靠的語(yǔ)言習(xí)得模型(language-acquisition model),用來(lái)描述機(jī)器和人類(lèi)如何學(xué)習(xí)語(yǔ)言,從而進(jìn)行在人類(lèi)實(shí)驗(yàn)對(duì)象中無(wú)法進(jìn)行的實(shí)驗(yàn)。
Begu?研究團(tuán)隊(duì)成員,華盛頓大學(xué)的神經(jīng)科學(xué)家Christina Zhao表示:
例如,我們可以創(chuàng)造一個(gè)不良的環(huán)境,比如一個(gè)被忽視的嬰兒,然后觀察是否會(huì)導(dǎo)致類(lèi)似語(yǔ)言障礙的情況。
此外,Begu?還說(shuō)正在嘗試看看這條路能夠走多遠(yuǎn),通用神經(jīng)元能夠多接近人類(lèi)語(yǔ)言。
我們能否通過(guò)擴(kuò)大和增強(qiáng)我們的計(jì)算架構(gòu),讓其性能達(dá)到與人類(lèi)相當(dāng)?shù)乃剑蛘吣軌蜃C明這永遠(yuǎn)是不可能的。
在我們確切知道這個(gè)問(wèn)題之前,還需要做更多的工作。但我們對(duì)這些系統(tǒng)的內(nèi)部運(yùn)作,對(duì)人類(lèi)和人工神經(jīng)網(wǎng)絡(luò)的相似之處,依然感到非常驚訝。
對(duì)于人腦與人工神經(jīng)網(wǎng)絡(luò)你有什么看法?
傳送門(mén):
[1]https://www.nature.com/articles/s41598-023-33384-9(論文鏈接)