成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

陶哲軒點評谷歌AlphaProof:AI在數學競賽中展現「超凡智慧」

人工智能 新聞
常用 AI 輔助證明的數學家陶哲軒近期正處在出差的忙碌中,對問題求解引擎 AlphaProof 和 AlphaGeometry2 還未完全消化。

在奧數問題面前,AI 的「智商」往往不太夠用。

不過,這已經是過去式了。谷歌 DeepMind 用 AI 做出了今年國際數學奧林匹克競賽 IMO 的真題,并且距拿金牌僅一步之遙。對于 AI 來說,奧數不再是問題了。

IMO 2024 中六個問題的每一個問題滿分為 7 分,總分最高 42 分。DeepMind 的系統最終得分為 28 分,意味著解決的 4 個問題都獲得了滿分 —— 相當于銀牌類別的最高分。

DeepMind 文章連接:https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

常用 AI 輔助證明的數學家陶哲軒近期正處在出差的忙碌中,對問題求解引擎 AlphaProof 和 AlphaGeometry2 還未完全消化。但他在自己的博客上對 DeepMind 的 AI 系統參加 IMO 競賽這件事表達了自己的看法。

圖片

陶哲軒談到,這是一項非常偉大的工作, 再次改變了我們對哪些基準挑戰可以通過 AI 輔助或完全自主的方法實現的期望。 

例如,IMO 級別的幾何問題現在對于專用的 AI 工具來說已基本解決。現在看來,通過強化學習過程可以找到形式化證明的 IMO 問題至少在某種程度上可以被 AI 攻克。雖然目前每個問題需要相當大的計算量,并且在形式化方面需要人類的幫助。

在陶哲軒看來,這種方法還有一些「buff 加成」,它能使形式化數學更容易自動化,這反過來可能會促進包含形式化成分的數學研究方法。如果更公開地共享由此產生的形式證明數據庫,它可能是一個有用的資源。 

這種方法(更多地基于強化學習而非大型語言模型,有點類似 AlphaGo 的精神,且強調整體方法)非常聰明,事后來看很有道理。正如「AI 效應」所言,一旦解釋清楚,它不會給人一種展示人類智能的感覺;但它仍然是我們 AI 輔助問題解決工具集能力的擴展。

圖片

「AI 效應」是指當人工智能技術取得進展或解決問題時,人們往往會認為這些成就并不是真正的人工智能或者不具備真正的智能。換句話說,一旦某項技術被理解或普及,它就不再被認為是智能的。這種現象表明,人們對 “智能” 的定義和期望會隨著技術的進步而不斷提高。 

本月月初,陶哲軒在自己的博客中發布 AI 數學奧林匹克競賽(AIMO 進步獎)的初步成績已公布的消息。其中,獲得第一名的是 Numina 的團隊。

他在最新博客中表示,DeepMind 的這些新工具無法與最近贏得 AIMO 進步獎的 NuminaMath 模型直接比較。NuminaMath 模型完全自動化且資源效率高出數個數量級,并且采用了完全不同的方法(使用大型語言模型生成 Python 代碼,以蠻力解決區域競賽級別的數值答案問題)。這個模型也是完全開源的。這也是非常不錯的工作,展示了嘗試使用 AI 來輔助或自動化數學問題解決過程的不同部分的多維挑戰。

其實 DeepMind 在數學推理方面有著不懈的努力。在今年年初,它的人工智能算法就已經在數學奧林匹克競賽(IMO)上取得了重大成績突破。論文《Solving olympiad geometry without human demonstrations》向世人介紹了 AlphaGeometry,還登上了國際權威期刊《自然》雜志。專家表示,這是人工智能朝著具有人類推理能力方向邁進的重要一步。

圖片


論文鏈接:https://www.nature.com/articles/s41586-023-06747-5

未來 DeepMind 還將帶給我們怎樣的驚喜,我們拭目以待。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-07-29 13:28:52

2025-06-03 08:15:00

2023-12-06 13:44:00

模型訓練

2024-02-26 08:30:00

2024-07-08 13:08:04

2024-07-04 15:28:11

2023-10-10 13:51:46

GPT-4GitHubAI

2024-12-09 09:35:00

AI數據訓練

2023-05-15 15:13:46

智能工作

2024-10-14 14:31:36

2025-06-12 14:20:35

谷歌DeepMindAI

2023-10-04 08:07:06

CopilotGitHub

2024-06-17 08:45:00

2025-05-22 09:08:40

2024-04-09 09:44:21

數學模型

2024-07-29 14:39:39

2025-06-23 08:45:00

2023-06-30 13:42:44

2024-04-15 12:29:00

AI訓練

2024-09-29 14:00:00

AI數學自動化
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品成人品 | 天堂av中文 | 国产乱精品一区二区三区 | 午夜精品一区二区三区三上悠亚 | 亚洲欧美激情四射 | 91视视频在线观看入口直接观看 | 超碰精品在线 | 中文字幕在线免费观看 | 一区二区电影网 | 国产999精品久久久久久 | 精品久久99 | 精品成人 | 欧美激情精品久久久久久免费 | 久久99久久99精品免视看婷婷 | 国产日产久久高清欧美一区 | 欧美视频免费在线观看 | 一区二区三区欧美在线观看 | 久久大全 | 91porn成人精品 | 午夜电影网 | 美女一级毛片 | 国产精品久久久久久久久 | 免费黄色的视频 | 午夜丰满少妇一级毛片 | 极品在线 | 欧美日韩综合 | 五月激情综合 | 91精品久久久久久久久 | 欧美日韩中文字幕在线播放 | 99re在线视频 | 国产av毛片 | 久久国产精品久久久久 | 日韩精品一区二区三区中文在线 | 成年人精品视频在线观看 | 国产露脸国语对白在线 | 国产在线视频网 | 亚洲欧美日韩国产综合 | 日日摸夜夜爽人人添av | 精品欧美色视频网站在线观看 | 狠狠色狠狠色综合日日92 | 夜夜爽99久久国产综合精品女不卡 |