《自然》重磅:微軟推出MatterGen ,AI 顛覆材料設(shè)計
剛剛,頂尖學(xué)術(shù)期刊《自然》(Nature)刊發(fā)了一項具有里程碑意義的研究成果:微軟研究院的研究團(tuán)隊成功開發(fā)了一種名為MatterGen的全新擴(kuò)散生成模型。MatterGen 的出現(xiàn)為材料科學(xué)的逆向設(shè)計開啟了一個全新的篇章,它不僅能夠生成覆蓋整個元素周期表、穩(wěn)定且多樣的無機材料,而且能夠通過微調(diào),精確地控制所生成材料的化學(xué)成分、對稱性以及包括磁性密度、力學(xué)性能、電子特性等在內(nèi)的多種物理性質(zhì)。
MatterGen的創(chuàng)新之處
MatterGen之所以能夠取得如此顯著的突破,源于其在模型架構(gòu)和訓(xùn)練方法上的多維度創(chuàng)新:
1. 定制化的擴(kuò)散過程: 針對晶體材料的特殊性,MatterGen引入了一套定制化的擴(kuò)散過程,該過程可以獨立地對原子類型、坐標(biāo)和晶格進(jìn)行擾動,并將其導(dǎo)向一個符合物理規(guī)律的隨機分布。這種方法在對晶體結(jié)構(gòu)中的原子坐標(biāo)進(jìn)行擾動時,充分考慮了周期邊界條件,并通過縮放噪聲大小,來消除晶胞尺寸的影響,從而確保了擾動的合理性和有效性。對于原子類型,MatterGen采用了掩碼(mask)方法,使其向“未確定”狀態(tài)擴(kuò)散,以便能夠生成新類型的結(jié)構(gòu)。對于晶格,該模型采用對稱形式的擴(kuò)散,使其趨向一個具有平均原子密度的立方晶格。
2. 等變性評分網(wǎng)絡(luò): 為了逆轉(zhuǎn)上述擴(kuò)散過程,MatterGen訓(xùn)練了一個等變性評分網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠輸出原子類型、坐標(biāo)和晶格的等變分?jǐn)?shù),從而無需直接從數(shù)據(jù)中學(xué)習(xí)對稱性,顯著提高了模型的效率和泛化能力。
3. 自適應(yīng)模塊與微調(diào): 為了控制生成過程,MatterGen 引入了自適應(yīng)模塊,這些模塊可以插入到基礎(chǔ)模型中的每一層,并根據(jù)給定的性質(zhì)標(biāo)簽來調(diào)整模型的輸出。此外,研究人員還采用了分類器自由引導(dǎo)(classifier-free guidance)的方法,進(jìn)一步引導(dǎo)生成過程朝向特定的目標(biāo)性質(zhì)。微調(diào)策略不僅能夠提升模型的表現(xiàn),還能在標(biāo)記數(shù)據(jù)量有限的情況下高效工作,這在材料科學(xué)領(lǐng)域至關(guān)重要,因為性質(zhì)計算的成本往往非常高昂。
4. 大規(guī)模數(shù)據(jù)集訓(xùn)練: MatterGen的卓越性能還得益于大規(guī)模、高質(zhì)量的訓(xùn)練數(shù)據(jù)集,即Alex-MP-20,它包含了來自Materials Project (MP)和Alexandria等數(shù)據(jù)庫的607,683個穩(wěn)定結(jié)構(gòu),覆蓋了多種化學(xué)元素和晶體結(jié)構(gòu)。通過如此龐大的數(shù)據(jù)集進(jìn)行訓(xùn)練,MatterGen能夠更好地理解晶體材料的規(guī)律,從而提高其生成穩(wěn)定、多樣材料的能力。
MatterGen的性能評估與實驗驗證
為了驗證MatterGen的性能,研究人員進(jìn)行了多方面的評估:
穩(wěn)定性評估: 研究人員使用密度泛函理論(DFT)計算對MatterGen生成的結(jié)構(gòu)進(jìn)行了能量弛豫,并證明絕大部分結(jié)構(gòu)的能量都接近于其局部最小值,表明了這些結(jié)構(gòu)的穩(wěn)定性。
多樣性評估: 研究結(jié)果顯示,即使生成數(shù)百萬個結(jié)構(gòu),MatterGen仍然能夠產(chǎn)生高度多樣性和獨特性,其發(fā)現(xiàn)新材料的能力遠(yuǎn)超傳統(tǒng)方法。此外,MatterGen還能重新發(fā)現(xiàn)訓(xùn)練數(shù)據(jù)中沒有的2000多個已知的實驗驗證結(jié)構(gòu),證明了其在材料發(fā)現(xiàn)方面的巨大潛力。
與現(xiàn)有模型對比: 通過與CDVAE, DiffCSP等先前先進(jìn)生成模型進(jìn)行對比,MatterGen顯著提升了S.U.N(穩(wěn)定、獨特、新穎)材料的生成比例,同時顯著降低了生成結(jié)構(gòu)與DFT弛豫結(jié)構(gòu)之間的均方根偏差(RMSD),證明了MatterGen在生成穩(wěn)定材料和逼近真實結(jié)構(gòu)方面的優(yōu)異性能。
化學(xué)成分引導(dǎo): MatterGen 在目標(biāo)化學(xué)系統(tǒng)中的表現(xiàn)也超越了傳統(tǒng)的替代法和隨機結(jié)構(gòu)搜索(RSS)方法,能夠更加高效地生成在目標(biāo)體系中處于能量凸包上的穩(wěn)定結(jié)構(gòu),尤其是在成分復(fù)雜的五元體系中優(yōu)勢更加顯著。
物理性質(zhì)引導(dǎo): MatterGen 能夠根據(jù)特定的磁性密度、帶隙和體積模量等物理性質(zhì)進(jìn)行微調(diào),生成符合目標(biāo)要求的材料,這也表明了 MatterGen 在逆向設(shè)計材料方面的強大能力,甚至能克服訓(xùn)練數(shù)據(jù)分布中出現(xiàn)的極端值的問題。
多目標(biāo)優(yōu)化: 為了滿足更復(fù)雜的實際需求,MatterGen 可以針對多個性質(zhì)同時進(jìn)行優(yōu)化,例如同時滿足高磁密度和低供應(yīng)鏈風(fēng)險的永磁材料。
實驗驗證: 作為概念驗證,研究團(tuán)隊通過實驗合成了MatterGen設(shè)計的一種材料 (TaCr2O6 ),并測量了其楊氏模量,推導(dǎo)出其體積模量與MatterGen的預(yù)測值相差僅20%,這有力地證明了MatterGen的實際應(yīng)用潛力。
寫在最后:
MatterGen的發(fā)布不僅僅是一項技術(shù)突破,它更代表著材料科學(xué)研究范式的轉(zhuǎn)變。研究團(tuán)隊相信,MatterGen的卓越性能和廣泛適用性使其有潛力成為未來材料科學(xué)領(lǐng)域的核心工具。