谷歌AlphaProof攻克國際奧賽數學題 數學家會不會被淘汰?
谷歌DeepMind發布消息稱,它所開發的AI系統AlphaProof和AlphaGeometry 2在數學上取得突破,解答了今年國際數學奧林匹克競賽(IMO)6道題中的4道,相當于銀牌水平。
谷歌還自豪宣稱,這是AI第一次取得如此耀眼的成績??上Ь拖裰八拇档钠渌麬I一樣,谷歌的說法也有夸大之嫌。
離金牌線只有一步之遙
根據谷歌的解釋,AlphaProof用增強學習技術在開源求證輔助系統Lean環境中證明數學命題。Lean是微軟公司計算機科學家萊昂納多·德莫拉開發的,采用了由所謂“有效的老式人工智能”(GOFAI)——即從邏輯學汲取靈感的符號人工智能——所驅動的自動推理。
谷歌系統具備自我學習能力,它生成并驗證數百萬個數學證明,在解決復雜數學問題時進步明顯。在此之前,谷歌開發過幾何AI模型,AlphaGeometry 2相當于升級版本,它是谷歌以Gemini語言模型作為基礎,用大量數據訓練出來的。
知名數學家Sir Timothy Gowers和Dr. Joseph Myers用國際數學奧林匹克競賽標準對谷歌AI系統進行評估,國際數學奧林匹克競賽的金牌線為29分,總分42分,谷歌系統拿到28分,離金牌線只有一步之遙。在最難的問題上谷歌系統完美解答,今年只有5人解決此問題。
國際數學奧林匹克競賽始于1959年,面向預科數學天才(也就是還沒進入大學的數學天才),主要涉及代數、組合數學、幾何和數論。
用競賽問題測試AI已經成為評估AI推理能力的重要標準。AlphaProof解決了兩個代數問題,一個數論問題;AlphaGeometry 2解決了一個幾何問題,但谷歌AI被兩個組合數學問題挫敗。在解決問題時,有一個只用了幾分鐘,其它耗時較長,最多三天。
谷歌AI用于數學也有局限
為什么說谷歌的說法也有夸大之嫌呢?
首先,谷歌將競賽問題轉化為正式數學語言,方便AI模型處理。這一做法與官方競賽流程不符,人類參賽者會直接面對問題。
AI模型可以生成文章或者其它形式的文本,但面對復雜數學問題時往往會捉襟見肘,因為當中牽涉到復雜的邏輯推理,這正是目前AI系統所欠缺的。復雜數學問題會涉及到抽象概念、子目標設定、回溯、嘗試新路徑,這些都給AI帶來挑戰。
專注于數學和AI研究的劍橋大學研究人員Katie Collins說:“如果你有辦法檢查答案(也就是正式語言),訓練數學AI模型就會容易很多,難點在于網上自然語言(非正式語言)數據超級多,但正式數學語言數據卻很少。”
谷歌DeepMind AI可以自動將用自然非正式語言編寫的數學問題轉化為正式語言,這是谷歌之所以取得突破的關鍵。愛丁堡大學混合AI講師Wenda Li說,對于數學社區而言,自動將非正式語言轉化為非正式語言是一大進步。
在參加今年的競賽之前,AlphaGeometry 2曾嘗試解答之前25年積累的國際數學奧林匹克競賽幾何問題,83%都能解答——之前的AI只能解答53%。面對今年的幾何問題,谷歌系統只用19秒就給出答案。
其次,谷歌AI模型花費的時間有時顯著過長。Sir Timothy Gowers承認DeepMind模型取得突破,表現遠超之前的自動定理證明者,但AI解答時花費的時間遠長于人類參賽者,有些問題需要的時間甚至超過60個小時,AI的處理速度本來比人類快很多,但還是需要更長時間,如果人類參賽者有同樣長的時間解答,得分肯定更高。
Sir Timothy Gowers還說,在正式答題之前,人類已經手動將題目轉化為正式語言Lean,然后AI才著手處理,雖然核心數學推理是由AI完成的,但“自動化”步驟卻由人類操刀。
替代數學家還需時日
到底谷歌系統會給數學研究造成什么影響?Sir Timothy Gowers只能說“不確定”。他表示:“是不是到了數學家即將成為多余的地步?很難說。我想我們離這個目標還差一個或者兩個突破。”
他認為,谷歌系統解答時需要更長時間說明AI并沒有很好解決數學問題,但在操作時應該發生了一些有趣的事情。
雖然存在諸多局限性,Sir Timothy Gowers仍認為類似的AI系統將會成為富有價值的研究工具。在程序的輔助下,對于那些不是特別難的問題(幾個小時就能解決),AI可以幫助數學家尋找答案,如此一來,即使AI本身無法解決開放問題,也能成為數學家的實用工具。
不管怎樣,開發一套AI系統,讓它解決富有挑戰的數學問題,可以為未來的人機協作掃清障礙,還可以讓人類深入了解自身是如何解決數學問題的。
當然必須意識到,在人類解決復雜數學問題方面,目前還有很多未解之謎,AI也一樣。(小刀)