「嗎嘍」在想啥?AI讀心術(shù)精準(zhǔn)重建獼猴大腦圖像,網(wǎng)友:我們成三體人了
不知道大家上學(xué)的時(shí)候有沒有被老師拎著耳朵,痛心疾首地問:
講了八十遍還錯(cuò)!我真想打開你們的腦子看看里面到底在想什么?!
我們無法敲開別人的大腦,很難知道知識(shí)到底有沒有鐫刻在大腦里。要想做到這一點(diǎn),好像只有神叨叨的讀心術(shù)能實(shí)現(xiàn)。
隨著AI技術(shù)的發(fā)展,不用開顱,不用植入設(shè)備,讀取頭腦里的想法好像真的能實(shí)現(xiàn)。
連想法都能可視化,這莫非就是現(xiàn)實(shí)版「攝魂取念」?
「攝魂取念」洞察人腦
早在2022年,就有科學(xué)家研究過如何將人腦中的圖像可視化。
大阪大學(xué)前沿生物科學(xué)研究院的教授兩位科學(xué)家Yu Takagi和Shinji Nishimoto就發(fā)表了一篇論文,用擴(kuò)散模型將大腦活動(dòng)重現(xiàn)為圖像。
論文地址:https://www.biorxiv.org/content/10.1101/2022.11.18.517004v2.full.pdf
兩位科學(xué)家招募了一群志愿者,讓他們每人看一萬(wàn)張自然風(fēng)景圖(不是一次性看完)。
看圖的時(shí)候,志愿者躺在核磁共振掃描儀里,這個(gè)大腦攝像機(jī)會(huì)記錄下所有的大腦活動(dòng)。
科學(xué)家得到腦內(nèi)活動(dòng)數(shù)據(jù)后,根據(jù)大腦不同的活躍部位,分為兩部分,一部分是初級(jí)視覺皮層信號(hào),另一部分是高級(jí)視覺皮層信號(hào)。
這些信號(hào)會(huì)化為簡(jiǎn)單線性模型里的小點(diǎn)點(diǎn),但想畫出能看懂的圖來,只靠它們是不行的。
科學(xué)家們會(huì)用到熱門的擴(kuò)散模型Stable Diffusion。只要輸入一段文字,就能自動(dòng)產(chǎn)生符合描述的圖畫。
結(jié)果發(fā)現(xiàn),生成的圖像和志愿者看到的實(shí)際圖像很接近,他們大腦里產(chǎn)生的畫面差不多就是這樣子。
「在我們這項(xiàng)研究之前,還沒有哪個(gè)研究人員嘗試用擴(kuò)散模型來重構(gòu)視覺圖像。」Shinji Nishimoto頗為激動(dòng)地告訴媒體。
此項(xiàng)研究成果一出,那是不是意味著我們真的可以和自己的小狗小貓交流了?
或者說,這項(xiàng)技術(shù)可不可以用來取證呢?將嫌疑人的想法掃描成圖像,破案分分鐘。
「嗎嘍」在想什么?
前陣子,嗎嘍表情包火了。
幾個(gè)小猴子頻頻能做出像人一樣的行為作態(tài),每一只甚至還有名有姓。
坐在嬰兒車?yán)锖蕊嬃希瑔釃D覺得飲料好不好喝?
小編晚上玩手機(jī)就這樣。那嗎嘍在看什么好玩的東西呢?
嗎嘍看到人類的爆炸頭心里在蛐蛐什么呢?怎么被嚇倒了?
荷蘭拉德布德大學(xué)的研究團(tuán)隊(duì)就在嘗試重現(xiàn)猴子腦中的圖像。
論文地址:https://www.biorxiv.org/content/10.1101/2024.06.04.596589v1
他們賦予人工智能系統(tǒng)專注于特定大腦區(qū)域的能力,能夠更好地從大腦記錄中重建猴子正在觀察的圖像。
第一行:原始圖像
第二行:人工智能根據(jù)獼猴的大腦記錄重建的圖像
第三行:人工智能系統(tǒng)在沒有注意力機(jī)制的情況下重建的圖像
現(xiàn)在,人工智能系統(tǒng)可以根據(jù)大腦活動(dòng)的記錄,非常準(zhǔn)確地重建一個(gè)人正在看什么。
當(dāng)人工智能進(jìn)一步學(xué)會(huì)關(guān)注大腦的哪些部分時(shí),這些重建圖像就會(huì)得到極大改善。
荷蘭拉德布德大學(xué)的Umut Gü?lü表示,「據(jù)我所知,這些是最接近、最準(zhǔn)確的重構(gòu)。」
Gü?lü的團(tuán)隊(duì)是全球使用人工智能系統(tǒng),通過大腦記錄和掃描,來了解動(dòng)物或人所看到的東西的團(tuán)隊(duì)之一。
在之前的一項(xiàng)研究中,他的團(tuán)隊(duì)使用功能性核磁共振成像(IMRI)掃描儀記錄了三個(gè)人在觀看一系列照片時(shí)的大腦活動(dòng)。
在另一項(xiàng)研究中,研究小組利用植入電極陣列直接記錄了一只獼猴在觀看人工智能生成的圖像時(shí)的大腦活動(dòng)。
Gü?lü的同事、拉德布德大學(xué)的Thirza Dado說,這只獼猴沒有被植入基因,因此我們無法重建它的感知,我們并沒有在猴子身上進(jìn)行手術(shù)。
現(xiàn)在,研究小組利用改進(jìn)后的人工智能系統(tǒng)重新分析了之前這些研究的數(shù)據(jù),這個(gè)系統(tǒng)可以定位大腦中哪些部分最值得關(guān)注。
「基本上,人工智能在解讀大腦信號(hào)時(shí),正在學(xué)習(xí)應(yīng)該將注意力引向何處,」Gü?lü說,「當(dāng)然,這在某種程度上反映了大腦信號(hào)在環(huán)境中捕捉到了什么。」
通過對(duì)大腦活動(dòng)的直接記錄,一些重建的圖像現(xiàn)在非常接近猴看到的圖像,而這些圖像是由Style GAN-XL人工智能圖像生成的。
Thirza Dado說,與真實(shí)圖像相比,準(zhǔn)確重建人工智能生成的圖像更容易,因?yàn)槿斯ぶ悄茉趯W(xué)習(xí)重建圖像的過程中,也會(huì)考慮到生成圖像的過程。
在使用注意力引導(dǎo)系統(tǒng)時(shí),fMRI掃描結(jié)果也有明顯改善,但重建圖像的準(zhǔn)確性稍有欠缺。
Dado說,這部分是因?yàn)槭褂昧苏鎸?shí)照片,但從fMRI掃描中重建圖像也要難得多。「它是無創(chuàng)的,但噪音非常大」。
研究小組的最終目標(biāo)是,通過刺激視覺系統(tǒng)中代表物體的高級(jí)部分,而不是簡(jiǎn)單地呈現(xiàn)光的模式,創(chuàng)造出更好的大腦植入物來重現(xiàn)視覺所見。
例如,你可以直接刺激與「狗」這個(gè)概念相對(duì)應(yīng)的部分,Güclǔ 說。「這樣,我們就能創(chuàng)造出更豐富的視覺體驗(yàn),更接近視力正常的人的視覺體驗(yàn)。」
最近發(fā)表了大量利用AI再現(xiàn)動(dòng)物所見的圖像,這種 「讀心術(shù)」的趨勢(shì)似乎正在擴(kuò)大,圖像的質(zhì)量也在提高。這是人工智能(即機(jī)器學(xué)習(xí))應(yīng)用越來越精確的必然結(jié)果。
網(wǎng)友:我們成三體人了?
對(duì)于這項(xiàng)技術(shù)將帶來什么應(yīng)用,網(wǎng)友們紛紛展開腦洞。
比如,顯然可以這種AI可以為醫(yī)學(xué)做出貢獻(xiàn),用在Neuralink的應(yīng)用程序上,就可以更好地了解人腦。
如果心靈感應(yīng)和腦機(jī)接口結(jié)合,我們?nèi)绻雽懽魇遣皇蔷筒挥脛?dòng)筆了?
當(dāng)然,事情也可能會(huì)往可怕的方向發(fā)展:如果思想不再自由,而是能夠被獵人射殺,情況恐怕就不妙了。
看來咱們離思想透明的三體人,距離是越來越近了。
思維書寫技術(shù)起飛后,肯定是有利有弊。
但還是有部分人表示欣慰:使用腦電波的計(jì)算機(jī)控制成真,這將是人機(jī)融合的最終目標(biāo)。