陶哲軒轉(zhuǎn)發(fā)！DeepMind開源「AI數(shù)學(xué)證明標(biāo)準(zhǔn)習(xí)題集」

2025-06-03 08:15:00

人工智能新聞

陶哲軒曾用Lean形式化證明了PFR猜想（多項(xiàng)式Freiman-Ruzsa猜想），這項(xiàng)成就的第一步就是將猜想的核心概念轉(zhuǎn)化為計算機(jī)可驗(yàn)證的形式化版本。

陶哲軒轉(zhuǎn)發(fā)，AI搞數(shù)學(xué)證明的標(biāo)準(zhǔn)習(xí)題集來了！

DeepMind最新開源形式化數(shù)學(xué)猜想庫——

猜想庫收錄了經(jīng)典的形式化表述的數(shù)學(xué)猜想集合，例如，解析數(shù)論中的四個朗道問題。

不僅如此，資源庫中還提供了各種代碼函數(shù)，以方便用戶對自然語言的數(shù)學(xué)猜想進(jìn)行形式化的表述。

目前，這位“數(shù)學(xué)界的計算機(jī)推廣大神”已轉(zhuǎn)發(fā)此項(xiàng)目，并表示：

“如果希望利用自動化工具幫助開放性問題，那么對這些問題進(jìn)行形式化表述是重要的第一步。”

DeepMind的形式化數(shù)學(xué)猜想庫一經(jīng)建成，團(tuán)隊(duì)就表示所有人都可以將數(shù)學(xué)猜想添加到資源庫中，呼吁大家積極參與。

感興趣的數(shù)學(xué)家們可以行動起來了。

形式化數(shù)學(xué)猜想庫有什么用

雖然帶證明的形式化定理語料庫不斷擴(kuò)充，但僅陳述開放式猜想的形式化資源卻十分稀缺。

這類資源有望成為自動定理證明或形式化工具的測試基準(zhǔn)，來幫助AI模型提升數(shù)學(xué)推理及證明能力。

DeepMind此次開源的猜想庫在一定程度上緩解了這個問題。

它收錄了使用Lean形式化表述的數(shù)學(xué)猜想集合，這些猜想來源于各個途徑，并且類型多樣。

下圖展示了題目類別統(tǒng)計。

這個猜想庫相當(dāng)于為計算機(jī)寫了一套形式化的“習(xí)題集”，還是能夠隨時擴(kuò)充并且自帶審核的那種！

有了這個“習(xí)題集”，傳統(tǒng)ATP（自動推理證明）就可以直接基于里面的命題進(jìn)行證明搜索，比如使用歸結(jié)法嘗試推導(dǎo)矛盾或驗(yàn)證等。

除此之外，將猜想庫作為訓(xùn)練數(shù)據(jù)，就能讓模型學(xué)習(xí)數(shù)學(xué)猜想的模式，AI就有可能提出新猜想。

例如，AlphaGeometry（DeepMind開發(fā)的專門用于自動解決奧林匹克幾何題的AI系統(tǒng)）就能夠依賴合成幾何猜想訓(xùn)練模型。

可以說，形式化數(shù)學(xué)猜想庫是AI+ATP范式的關(guān)鍵前置步驟。

目前，該猜想庫剛剛起步，團(tuán)隊(duì)希望更多人能參與其中，豐富猜想庫的內(nèi)容。

所有感興趣的用戶都可以通過以下這幾種方式參與其中：

1. 添加新的問題形式化：猜想可以來自各種地方，包括數(shù)學(xué)教科書、研究論文、專用問題列表等。

2. 提出你希望的形式化問題：建議包含參考文獻(xiàn)鏈接和精確的非正式表述。

3. 改進(jìn)問題的引用和標(biāo)記：為現(xiàn)有命題添加參考文獻(xiàn)或補(bǔ)充AMS學(xué)科分類標(biāo)簽。

4. 修復(fù)錯誤的形式化：鼓勵通過提交PR修復(fù)不準(zhǔn)確的表述，或提交issue反饋潛在缺陷。

那么如何操作呢？

接下來，讓我們給大家解答。

流程大致分為這樣幾個步驟：

首先，你要在在GitHub上創(chuàng)建問題，清晰描述計劃貢獻(xiàn)的內(nèi)容，包括對要添加的數(shù)學(xué)猜想的概述、相關(guān)背景信息以及自己對該猜想的初步理解等，然后將問題分配給自己，以便跟蹤和管理貢獻(xiàn)進(jìn)度。

并且，可以從官方倉庫Fork一份到自己的GitHub賬戶下進(jìn)行修改。

然后，按照倉庫的目錄結(jié)構(gòu)和組織方式，確定猜想應(yīng)該放置的具體的位置，再將你的形式化猜想添加到適當(dāng)?shù)奈募?目錄結(jié)構(gòu)中。

下一步就是在本地運(yùn)行l(wèi)ake build命令，避免出現(xiàn)語法錯誤或其他導(dǎo)致系統(tǒng)無法正常運(yùn)行的問題，確保添加或修改后的代碼能夠成功構(gòu)建。

完成上述步驟就可以向官方倉庫提交拉取請求了，隨后等待即可～

并且，由于無證明的數(shù)學(xué)猜想的形式化過程中可能出現(xiàn)細(xì)微錯誤，猜想庫將通過人工審核和AlphaProof（通用數(shù)學(xué)自動證明系統(tǒng)，結(jié)合了LLM和符號推理引擎）輔助識別。

DeepMind與陶哲軒

說來，陶哲軒與DeepMind也是互動頗多。

早在2023年，DeepMind提出FunSearch——一種能夠?yàn)閿?shù)學(xué)和計算機(jī)科學(xué)問題搜索解決方案的方法。

陶哲軒就曾稱贊FunSearch是“利用LLM進(jìn)行數(shù)學(xué)發(fā)現(xiàn)的有前途的范式” 。

該方法首次證明LLMs可以生成用計算機(jī)代碼編寫的函數(shù)，相關(guān)工作發(fā)表在《Nature》雜志上。

就在前不久，谷歌DeepMind與陶哲軒等一眾頂尖科學(xué)家一起共同打造了AlphaEvolve——一個LLM驅(qū)動的進(jìn)化編碼Agent，用于通用算法的發(fā)現(xiàn)與優(yōu)化。

幾百年未曾解決的幾何挑戰(zhàn)接吻數(shù)（Kissing Number）問題，也都因?yàn)樗某霈F(xiàn)前進(jìn)了一大步。

它發(fā)現(xiàn)了一個由593個外球體組成的結(jié)構(gòu)，直接刷新了11維空間中的下限。

AlphaEvolve團(tuán)隊(duì)將其應(yīng)用于數(shù)學(xué)分析、幾何學(xué)、組合學(xué)和數(shù)論等多個領(lǐng)域。

在大約75%的案例中，它能夠重新發(fā)現(xiàn)最先進(jìn)的解決方案。

在20%的案例中，它改進(jìn)了之前已知的最佳解決方案。

可以說，這是AI與數(shù)學(xué)的一次里程碑式碰撞。

陶哲軒表示AlphaEvolve的數(shù)學(xué)潛力仍在開發(fā)之中，讓我們一起期待更多進(jìn)展吧。

形式化數(shù)學(xué)猜想庫：https://google-deepmind.github.io/formal-conjectures/項(xiàng)目地址：https://github.com/google-deepmind/formal-conjectures

責(zé)任編輯：張燕妮來源：量子位

陶哲軒 AI 開源

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

陶哲軒轉(zhuǎn)發(fā)！DeepMind開源「AI數(shù)學(xué)證明標(biāo)準(zhǔn)習(xí)題集」

形式化數(shù)學(xué)猜想庫有什么用

DeepMind與陶哲軒