陶哲軒轉(zhuǎn)發(fā)!DeepMind開源「AI數(shù)學(xué)證明標(biāo)準(zhǔn)習(xí)題集」
陶哲軒轉(zhuǎn)發(fā),AI搞數(shù)學(xué)證明的標(biāo)準(zhǔn)習(xí)題集來了!
DeepMind最新開源形式化數(shù)學(xué)猜想庫——
猜想庫收錄了經(jīng)典的形式化表述的數(shù)學(xué)猜想集合,例如,解析數(shù)論中的四個朗道問題。
不僅如此,資源庫中還提供了各種代碼函數(shù),以方便用戶對自然語言的數(shù)學(xué)猜想進(jìn)行形式化的表述。
陶哲軒曾用Lean形式化證明了PFR猜想(多項(xiàng)式Freiman-Ruzsa猜想),這項(xiàng)成就的第一步就是將猜想的核心概念轉(zhuǎn)化為計算機(jī)可驗(yàn)證的形式化版本。
目前,這位“數(shù)學(xué)界的計算機(jī)推廣大神”已轉(zhuǎn)發(fā)此項(xiàng)目,并表示:
“如果希望利用自動化工具幫助開放性問題,那么對這些問題進(jìn)行形式化表述是重要的第一步。”
DeepMind的形式化數(shù)學(xué)猜想庫一經(jīng)建成,團(tuán)隊(duì)就表示所有人都可以將數(shù)學(xué)猜想添加到資源庫中,呼吁大家積極參與。
感興趣的數(shù)學(xué)家們可以行動起來了。
形式化數(shù)學(xué)猜想庫有什么用
雖然帶證明的形式化定理語料庫不斷擴(kuò)充,但僅陳述開放式猜想的形式化資源卻十分稀缺。
這類資源有望成為自動定理證明或形式化工具的測試基準(zhǔn),來幫助AI模型提升數(shù)學(xué)推理及證明能力。
DeepMind此次開源的猜想庫在一定程度上緩解了這個問題。
它收錄了使用Lean形式化表述的數(shù)學(xué)猜想集合,這些猜想來源于各個途徑,并且類型多樣。
下圖展示了題目類別統(tǒng)計。
這個猜想庫相當(dāng)于為計算機(jī)寫了一套形式化的“習(xí)題集”,還是能夠隨時擴(kuò)充并且自帶審核的那種!
有了這個“習(xí)題集”,傳統(tǒng)ATP(自動推理證明)就可以直接基于里面的命題進(jìn)行證明搜索,比如使用歸結(jié)法嘗試推導(dǎo)矛盾或驗(yàn)證等。
除此之外,將猜想庫作為訓(xùn)練數(shù)據(jù),就能讓模型學(xué)習(xí)數(shù)學(xué)猜想的模式,AI就有可能提出新猜想。
例如,AlphaGeometry(DeepMind開發(fā)的專門用于自動解決奧林匹克幾何題的AI系統(tǒng))就能夠依賴合成幾何猜想訓(xùn)練模型。
可以說,形式化數(shù)學(xué)猜想庫是AI+ATP范式的關(guān)鍵前置步驟。
目前,該猜想庫剛剛起步,團(tuán)隊(duì)希望更多人能參與其中,豐富猜想庫的內(nèi)容。
所有感興趣的用戶都可以通過以下這幾種方式參與其中:
1. 添加新的問題形式化:猜想可以來自各種地方,包括數(shù)學(xué)教科書、研究論文、專用問題列表等。
2. 提出你希望的形式化問題:建議包含參考文獻(xiàn)鏈接和精確的非正式表述。
3. 改進(jìn)問題的引用和標(biāo)記:為現(xiàn)有命題添加參考文獻(xiàn)或補(bǔ)充AMS學(xué)科分類標(biāo)簽。
4. 修復(fù)錯誤的形式化:鼓勵通過提交PR修復(fù)不準(zhǔn)確的表述,或提交issue反饋潛在缺陷。
那么如何操作呢?
接下來,讓我們給大家解答。
流程大致分為這樣幾個步驟:
首先,你要在在GitHub上創(chuàng)建問題,清晰描述計劃貢獻(xiàn)的內(nèi)容,包括對要添加的數(shù)學(xué)猜想的概述、相關(guān)背景信息以及自己對該猜想的初步理解等,然后將問題分配給自己,以便跟蹤和管理貢獻(xiàn)進(jìn)度。
并且,可以從官方倉庫Fork一份到自己的GitHub賬戶下進(jìn)行修改。
然后,按照倉庫的目錄結(jié)構(gòu)和組織方式,確定猜想應(yīng)該放置的具體的位置,再將你的形式化猜想添加到適當(dāng)?shù)奈募?目錄結(jié)構(gòu)中。
下一步就是在本地運(yùn)行l(wèi)ake build命令,避免出現(xiàn)語法錯誤或其他導(dǎo)致系統(tǒng)無法正常運(yùn)行的問題,確保添加或修改后的代碼能夠成功構(gòu)建。
完成上述步驟就可以向官方倉庫提交拉取請求了,隨后等待即可~
并且,由于無證明的數(shù)學(xué)猜想的形式化過程中可能出現(xiàn)細(xì)微錯誤,猜想庫將通過人工審核和AlphaProof(通用數(shù)學(xué)自動證明系統(tǒng),結(jié)合了LLM和符號推理引擎)輔助識別。
DeepMind與陶哲軒
說來,陶哲軒與DeepMind也是互動頗多。
早在2023年,DeepMind提出FunSearch——一種能夠?yàn)閿?shù)學(xué)和計算機(jī)科學(xué)問題搜索解決方案的方法。
陶哲軒就曾稱贊FunSearch是“利用LLM進(jìn)行數(shù)學(xué)發(fā)現(xiàn)的有前途的范式” 。
該方法首次證明LLMs可以生成用計算機(jī)代碼編寫的函數(shù),相關(guān)工作發(fā)表在《Nature》雜志上。
就在前不久,谷歌DeepMind與陶哲軒等一眾頂尖科學(xué)家一起共同打造了AlphaEvolve——一個LLM驅(qū)動的進(jìn)化編碼Agent,用于通用算法的發(fā)現(xiàn)與優(yōu)化。
幾百年未曾解決的幾何挑戰(zhàn)接吻數(shù)(Kissing Number)問題,也都因?yàn)樗某霈F(xiàn)前進(jìn)了一大步。
它發(fā)現(xiàn)了一個由593個外球體組成的結(jié)構(gòu),直接刷新了11維空間中的下限。
AlphaEvolve團(tuán)隊(duì)將其應(yīng)用于數(shù)學(xué)分析、幾何學(xué)、組合學(xué)和數(shù)論等多個領(lǐng)域。
在大約75%的案例中,它能夠重新發(fā)現(xiàn)最先進(jìn)的解決方案。
在20%的案例中,它改進(jìn)了之前已知的最佳解決方案。
可以說,這是AI與數(shù)學(xué)的一次里程碑式碰撞。
陶哲軒表示AlphaEvolve的數(shù)學(xué)潛力仍在開發(fā)之中,讓我們一起期待更多進(jìn)展吧。
形式化數(shù)學(xué)猜想庫:https://google-deepmind.github.io/formal-conjectures/項(xiàng)目地址:https://github.com/google-deepmind/formal-conjectures