百年微分方程難題被解決!神經元相互作用方式有了解析解描述,作者:可以模擬大腦動力學了 | MIT
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
困擾數學家百年的微分方程難題,被MIT解決了!
這個微分方程可以用來模擬神經元間通過突觸的相互作用方式,換言之就是大腦傳遞信息的過程。現實生活中有諸多應用場景,比如自動駕駛、大腦和心臟的監測等。
然而,以前求解這個微分方程的過程比較復雜,計算量還會隨著數據的增加而暴增——
模擬幾個神經元之間的信息傳遞還好。但如果像人腦一樣,有幾百億個神經元、幾百萬億個突觸呢?
現在,研究人員終于找到了這個微分方程的近似解析解,一下子將計算速度提升了好幾倍。
要知道,論文第一作者表示,從1907年以來,就一直沒有人能找到這個微分方程的解析解。
牽一發而動全身,論文第一作者還放話稱:
由數十億個神經元和數萬億個突觸組成的大腦動力學,我們現在也可以模擬了!
還有網友表示:
這將會改善神經網絡對大規模數據計算的適應能力。點個贊!
相關論文已發表在最新一期的Nature MI上,立刻引發了不少關注:
到底是什么樣的一個數學難題,能夠讓網友產生這樣大的反應,一起來看看~
解決了一個什么樣的難題?
這次MIT的突破,在于找到了兩個神經元之間通過突觸相互作用微分方程的近似解析解。
突觸,即一個神經元的沖動傳到另一個神經元或另一細胞間的相互接觸的結構。兩個神經元之間神經沖動,則是由突觸前末梢,傳遞給突觸后神經元的。
要模擬神經元間通過突觸相互作用的過程,就需要模擬傳導的動作電位。
MIT研究人員先是用去年做出來的“液體”神經網絡 (Liquid Time-constant Networks,簡稱LTC)模擬了這一現象。
如下圖,x(t)就是研究希望求解的突觸后神經元電位,但之前它需要通過直接求解微分方程來計算,也就是圖中左邊的一大堆方程:
BUT,他們很快發現,LTC神經網絡模型雖然模擬得好,但常微分方程(ODE)計算還是不夠快,通常需要結合ODE求解器來搞定。
即通過左邊的一堆公式,雖然在給定時間t的情況下也能算出x(t)來,但它不僅算得慢,而且誤差還會隨著求解過程中的迭代計算一步步被放大。
但如果能求出x(t)的解析解,也就是求出等式右邊不包含x(t)這個變量的公式,那么計算效率就能得到成倍的提升。
然而,求解這個常微分方程dv/dt=?glv(t)+S(t)的方法,從1907年提出以來還沒有人求出過它的解析解。
在通過一番計算后,研究人員終于得出了這個微分方程的近似解析解,能很好地近似出x(t)的數值:
最關鍵的是解析解能“一步到位”地求出結果,研究人員表示這比正常求微分方程模型快上1~5倍。
依靠這個新的近似解析解,研究人員提出了一種名叫CfC (closed-form continuous-depth networks,閉式連續深度神經網絡)的模型,進一步提升了計算效率、降低了微分方程求解帶來的近似誤差(approximation error)。
求解出來與原微分方程的相似度也極高:
所以CfC的提出,究竟解決了什么問題?
作者:下一步建立大腦計算模型
提到CfC的作用,還得先說回它的基礎,也就是MIT去年建立的“液體”神經網絡(LTC)。
△圖源:MIT
當時“液體”神經網絡的提出,是用于簡化如視頻處理、金融數據和醫療診斷這類與連續時間強相關的問題計算。
這類問題往往與時間的相關度很高,這也導致它們的變化情況難以預測,往往需要求解非常復雜的偏微分方程。
“液體”神經網絡就是為了解決這一點出現的,確實也提升了這類場景的計算效率。
然而,建立“液體”神經網絡的靈感雖然來自小物種的大腦,具有很強的靈活性和適應能力,不過計算量仍然不算低——
一旦增加神經元和突觸的數量,計算機可能就因為數據計算量過大“撐不住”了。
這不,今年MIT就帶著CfC神經網絡來了!
與“Liquid”神經網絡相比,CfC可謂去粗取精,它既保留了“Liquid”網絡的靈活、因果、穩定和可解釋性,同時數量級更快、可擴展性更高。
換句話說,就是CfC更快更強了,而這也意味著它能夠適用于更多任務。
論文中的測試結果顯示,CfC在一系列任務中表現都要優于SOTA神經網絡。
比如說在一項醫學預測任務中,對8000名患者進行抽樣調查,新模型的速度要比連續潛伏模型快220倍。
其中,CfC在從運動傳感器識別人類活動、建立模擬步行機器人的物理動力學模型以及基于事件的連續圖像處理方面具有相當高的加速度和性能。
而這對應到現實的實際應用,就是無人駕駛、無人機導航或者各類預測任務。
值得一提的是,據MIT消息,此前也已有證據證明,CfC神經網絡能夠在沒有額外學習的情況下將所學技能遷移到一個全新的環境中,這恰恰是人工智能研究最基本的挑戰之一。
(沒錯,CfC也是不容小覷的)
這一步研究團隊解決了神經元之間如何相互作用的描述,那下一步準備干啥?他們立了個flag:
希望通過測量數百萬個神經元連接,建立大腦動力學模型。
論文的第一作者,同時也是MIT CSAIL研究所附屬機構的Ramin Hasani也表示:
一旦我們對神經元和突觸的聯系有了一個解析解描述,我們就可以用數十億個細胞建立大腦的計算模型了。
據神經學家估計,人腦神經元數量在1000億個左右,不知道團隊是否會挑戰“模擬人類大腦”這一難題(手動狗頭)。
目前CfC模型已經開源,想要拿它用來模擬一些問題計算的小伙伴,可以去看看了~
CfC項目地址:?https://github.com/raminmh/CfC?
論文地址:
?https://www.nature.com/articles/s42256-022-00556-7