突破神經網絡限制,量子蒙特卡洛研究新進展登Nature子刊
時隔四個月,ByteDance Research 與北京大學物理學院陳基課題組又一合作工作登上國際頂級刊物 Nature Communications:論文《 Towards the ground state of molecules via diffusion Monte Carlo on neural networks 》將神經網絡與擴散蒙特卡洛方法結合,大幅提升神經網絡方法在量子化學相關任務上的計算精度、效率以及體系規模,成為最新 SOTA。
- 論文鏈接:
??https://www.nature.com/articles/s41467-023-37609-3? - 代碼地址:
??https://github.com/bytedance/jaqmc?
簡介
作者將基于神經網絡的試探波函數運用于固定節點面的擴散蒙特卡洛方法 (Diffusion Monte Carlo, or DMC) ,用以精確計算具有不同電子特性的原子以及分子系統。
擴散蒙特卡洛方法是量子化學領域精確計算分子和材料基態能量的常用方法之一。通過與擴散蒙特卡洛方法結合,作者顯著提高了量子化學中神經網絡 SOTA 方法的計算精度與效率。此外作者還提出了一種基于經驗線性關系的外推方法,大幅改善了分子結合能計算??傮w而言,該計算框架作為求解量子多體問題的高精度方法,為化學分子性質的深入理解提供了更強大的工具。
基于神經網絡的量子蒙特卡洛方法
2018 年以來,多個研究小組將神經網絡運用于變分蒙特卡洛方法 (Variational Monte Carlo, or VMC) 中 [1,2,3],借助神經網絡強大的表達能力,得到了更為精確的分子基態能量。本工作于 2022 年公開時,基于神經網絡的變分蒙特卡洛方法中的 SOTA 工作是 DeepMind 于 2019 年提出的 FermiNet [2],能夠在規模較小的體系上得到非常精確的結果。然而變分蒙特卡洛方法的精度受限于神經網絡的表達能力,在處理較大體系時會有越來越明顯的精度問題。此外該類方法在處理較大體系時收斂非常緩慢,對計算資源提出了巨大挑戰。
擴散蒙特卡洛方法作為量子化學領域的經典高精度算法之一,具有精度高、可并行性好、適合進行大規模計算等良好的特性。此外擴散蒙特卡洛可以突破神經網絡的表達能力限制,利用投影算法超越變分蒙特卡洛方法的精度。
本工作中,作者將 SOTA 的神經網絡 (FermiNet) 作為試探波函數與擴散蒙特卡洛方法結合。新的計算方法相比于 FermiNet 顯著提升了精度并減少了所需的計算步數。本工作中所設計并實現的擴散蒙特卡洛軟件具有神經網絡友好、GPU 友好、并行友好的特點,可以與廣泛的神經網絡波函數結合,自動提升其精度與效率。
計算結果
1. 原子?
使用神經網絡對大型分子體系進行量子蒙特卡洛計算時,由于算力限制,所能使用的神經網絡的表達能力也會受到一定限制。為了模擬這一場景,作者使用了僅僅兩層的神經網絡來研究第二、三排的原子。計算結果顯示隨著體系變大,變分蒙特卡洛方法的精度愈來愈差,而擴散蒙特卡洛方法所帶來的精度提升也愈來愈明顯。
2. 分子?
作者在一系列分子體系上也驗證了基于神經網絡的擴散蒙特卡洛方法的有效性,包括氮氣分子,環丁二烯以及雙水分子。在所測試的體系上均觀察到了明顯的計算精度提升。
3. 苯環及雙苯環?
本工作公開前,量子化學領域中基于變分蒙特卡洛的神經網絡波函數方法只處理過 30 電子以內的小型分子。本工作首次將神經網絡波函數方法應用于 42~84 個電子的體系,即苯環與雙苯環。計算結果顯示,擴散蒙特卡洛方法在精度上顯著優于變分蒙特卡洛方法,同時可以用少一個數量級的計算步數達到相同或更優的精度。
4. 線性關系及外推方法?
作者在考察神經網絡的不同訓練階段所對應的能量時,在很多體系上均發現變分蒙特卡洛與擴散蒙特卡洛的計算結果具有經驗性的線性關系(下左圖)。使用該線性關系對雙苯環的解離能計算進行外推,顯著提升了計算精度,得到了吻合于化學實驗的結果(下右圖)。
結語與展望
本工作表明,基于神經網絡的擴散蒙特卡洛方法在精度與效率上均優于變分蒙特卡洛方法。作者開源的擴散蒙特卡洛代碼可以與量子化學領域不斷推陳出新的神經網絡 [4,5] 快速結合,實現對研究社區的賦能。此外擴散蒙特卡洛方法也可以與處理真實固體的周期性神經網絡 [6]、帶贗勢的神經網絡 [7] 等一系列方法結合,在相應任務上提升計算效果。