Grok 3沖擊諾獎級突破,成證明「黎曼猜想」關鍵!AI與數學家打出終極組合拳
困擾人類一個多世紀的「黎曼猜想」,如今可能正站在被破解的邊緣。
這周發布的Grok 3異軍突起,不僅橫掃各大排行榜,更將目光投向了這個「猜想界的皇冠」。
風投機構IBC Group創始人Mario Nawfal發文稱,破解黎曼猜想的競賽正在升溫,而Grok 3可能正是關鍵所在!
究竟是什么原因,讓他敢于做出這樣一個判斷?
- 暴力計算:憑借足夠的計算能力和驗證器,AI可以窮舉所有解法。
- 人工智能+人類合作 :AI輔助頂尖科學家,可能會帶來圖靈獎、菲爾茲獎,甚至諾獎級別的突破。
有了這雙重buff的加持,Grok估計什么時候可以解決這一世紀難題?根據馬斯克的預測,「基于AI的進展,可能將在兩年內實現」。
在Mario看來,雖然目前還沒有解決方案——但Grok 3正在逐步接近破解這個數學界最大的未解之謎之一!
網友對此激動地表示,「暴力計算和人類洞察力的結合,簡直是終極組合拳」。
甚至,還有人大膽預言,下一個諾獎得主就是AI。
Grok 3對決黎曼猜想:突破即將到來?
在Grok 3還未橫空出世之前,曾被xAI工程師硬廣了一波。
去年11月,工程師Hieu Pham「爆料」稱,Grok 3證明了黎曼猜想。
為此,xAI不得不終止模型訓練,以驗證它的證明。他表示,如果結果是正確的,將會完全終止模型的訓練。
之后,Hieu Pham發帖稱這只是自己的惡搞
要知道,黎曼猜想可是千禧年七大數學難題之一。
這一次,基于20萬塊GPU訓出的Grok 3,在數學基準測試中AIME 2024上刷新SOTA,創下了52高分。mini版本性能幾乎與Claude 3.5 持平。
與此同時,xAI團隊專門針對最新AIME 2025基準,對Grok 3模型推理版本進行了測試,更是創下了93分紀錄。
AI大神Karpathhy在Grok 3還未發布之前,曾拿到了灰度測試資格,讓其去證明黎曼猜想猜想。
他表示,相較于其他模型(如o1-pro、Claude、Gemini 2.0 Flash Thinking),只會簡單表示——這是一個偉大的未解之謎,Grok 3非常有勇氣,會嘗試去解決問題。
雖然沒有攻克,但是邁出了「嘗試」的重要一步。
正如Karpathhy所言,誰知呢,總會有那么一天...
甚至,就連菲爾茲獎得主陶哲軒大膽預測,2026年,AI將與搜索和符號數學工具相結合,成為數學研究中值得信賴的合著者。
對此,有網友對于人工智能輔助破解數學謎題的前景感到興奮。
更有網友期待Grok 3將量子力學與相對論一起聯系起來。
「可能性是無限的」該網友評論道。
Grok 3全面領先!
Grok 3目前在聊天機器人競技場(Chatbot Arena)上大幅領先,并且是長期以來第一個在所有類別中都排名第一的模型。
這些排名是基于人類的盲測評估得出的。
對此,馬斯克表示,Grok位居第一,并持續改進。
「這個結果是基于兩周前的Grok版本。自那時以來Grok有顯著改進。」他表示。
網友Gavin Baker評論說,從2022年夏季到2024年春季,OpenAI曾大幅領先,隨后谷歌和Anthropic趕上了GPT-4的水平。
OpenAI能夠主導大約7個季度,這歸功于他們率先積極押注于預訓練的傳統「Scaling Law」。然而,率先實現o1級別的推理僅僅使得OpenAI領先幾個月。
目前,Deepseek、谷歌和xAI與OpenAI大致處于同等水平。xAI甚至可以說處于領先地位。
谷歌和xAI的基礎模型更優秀,因此它們很可能很快就會徹底超越o3。因此,OpenAI迫切需要GPT-5,作為假定的o5推理模型的基礎。
奧特曼指出,OpenAI未來的領先優勢將會縮小。微軟CEO納德拉也基本表示認同,OpenAI在模型能力方面擁有巨大領先優勢的時期即將結束。
網友Gavin表示,在他看來,這就是為什么Nadell根據Theinformation的消息,選擇不為OpenAI 1600億美元的預訓練提供資金的原因。相反,他希望通過為OpenAI提供推理服務來賺錢。
Google和xAI都擁有獨特且有價值的數據來源,這將使它們與Deepseek、OpenAI和Anthropic之間的差異越來越大。如果Meta在模型能力方面趕上來,情況也是如此。
Gavin同時指出,無法獲得獨特、有價值數據的前沿模型是歷史上貶值最快的資產。模型蒸餾只會加劇這種情況。
Nadella在最近一次播客中說,數據中心建設過剩即將到來,租用比購買更好。甚至在某個時候,微軟可能會使用開源模型來驅動CoPilot。
未來的前沿模型,如果無法獲得像YouTube、X、TeslaVision、Instagram和Facebook這樣獨特、有價值的數據,可能無法獲得任何投資回報 (ROI)。從這個角度來看,扎克伯格的策略似乎也更加合理。獨特的數據最終可能成為區分多萬億或千萬億參數模型預訓練的唯一基礎,也是獲得投資回報的唯一基礎。
如果這是正確的,那么只有2-3家公司會進行前沿模型的預訓練,我們只需要少數幾個巨型數據中心來構建預訓練所需的相干集群。
其余的人工智能計算將由較小的數據中心完成,這些數據中心在地理位置上進行了優化,以實現低延遲和/或具有成本效益的推理。具有成本效益的推理等于更便宜、質量較低的電力(對核電的需求減少),在短期內對液冷的需求減少等。
這與目前6-10家公司都在進行前沿模型預訓練的世界截然不同。
推理模型需要極高的計算量。測試時計算意味著計算能力本身就是智能。因此,在這種情況下,所需的計算量甚至可能比2023-2024年整個市場所預期的以「預訓練」為中心的計算場景還要多。
但這將是一種截然不同的計算類型,如上所述。預訓練和推理之間的比例將不再是50/50,而是5/95。基礎設施的卓越性將至關重要。
對于網友Gavin Baker的這番分析,馬斯克也表示認同。
「良好的分析」他評論道。
用戶離開ChatGPT轉向Grok
有網友在x發文稱,現在大量用戶正在在從ChatGPT轉向Grok,并配上了一段形象的視頻。
有網友調侃說,他妻子嫉妒Grok 3,因為他跟Grok 3說的話比跟他妻子還多。
對于大家紛紛轉向Grok這事兒,網友紛紛表示贊同。
什么是黎曼猜想?
黎曼猜想是一個數學領域里非常重要但至今沒有解決的問題,它主要研究質數的分布規律,以及一個叫黎曼zeta函數的數學工具跟質數的關系。
質數是那些大于1、只能被1和自己整除的數字,比如2、3、5、7、11、13等等。它們像是自然數的「積木」,因為任何一個自然數都可以拆成質數的乘積,比如15 = 3 × 5。
質數的出現看起來很隨機,沒有簡單的規律可循。
比如在1到10里有4個質數(2、3、5、7),11到20里也有4個(11、13、17、19),但21到30里只有2個(23、29),數量分布不太好預測。
這讓研究質數分布成了數學中一個大難題。
質數的研究不只是數學家的興趣,它在現實生活中也很重要。比如,互聯網上的安全通信(像網上銀行、購物)靠一種叫RSA的密碼系統保護,而RSA的基礎就是利用大質數的不可預測性。
什么是黎曼zeta函數
1859年,德國數學家伯恩哈德·黎曼(Bernhard Riemann)想出了一個研究質數的新辦法,引入了一個叫黎曼zeta函數的東西,記作ζ(s)。
簡單來說,zeta函數是一個無限加法公式:
這里的「s」是一個復數,復數是一種特別的數字,比如s = a + bi(a是實部,b是虛部,i是虛數單位)。
這個函數的神奇之處在于,它跟質數的分布有很深的聯系。
zeta函數的零點
零點就是讓ζ(s)等于0的s值。研究發現,這些零點分成兩類:
- 平凡零點:這些零點出現在s = -2, -4, -6等負的偶數位置。它們比較容易找到,性質也很明確。
- 非平凡零點:這些零點的實部(a值)在0到1之間,而且虛部(b值)不是0。它們的位置很神秘,很難算出來。目前通過計算機檢查發現,所有已知的非平凡零點的實部都是1/2,但這只是觀察結果,還沒有數學證明能確認所有零點都這樣。
黎曼猜想到底在猜什么?
黎曼猜想的核心是:所有的非平凡零點的實部都等于1/2。
想象一下,把復數s = a + bi畫在平面上,橫軸是實部a,縱軸是虛部b。
黎曼猜想說,所有非平凡零點都會整整齊齊地排在實部a = 1/2這條豎線上。
如果這個猜想是真的,它能讓我們更清楚地知道質數是怎么分布的。
比如,它能更精確地預測某個范圍內有多少個質數。這跟一個叫素數定理的東西有關,素數定理告訴我們質數的「大趨勢」,而黎曼猜想則能解釋趨勢里的「小起伏」。
打個比方,把質數分布想象成一條河的流量,素數定理像是告訴你河水平均每天流多少水;黎曼猜想則是幫你搞清楚為什么有些天水流多些,有些天少些。
這種對質數的深入了解不只對數學家重要,還會影響像密碼學這樣的領域,因為密碼系統需要質數盡量「隨機」。
為什么這么受關注?
黎曼猜想從1859年提出到現在,已經160多年了,但還是沒人能證明它是對是錯。
它被認為是數學里最重要的問題之一,出現在1900年希爾伯特提出的23個數學難題里(第8個問題),也被2000年Clay數學研究所列為「千禧年七大難題」之一。
Clay研究所還懸賞100萬美元,鼓勵全世界數學家來挑戰這個問題。現在,計算機已經檢查了無數個非平凡零點,發現它們的實部都是1/2,但這只是證據,不是嚴格的數學證明。
一些數學家,比如Larry Guth和James Maynard,最近在這個問題上有了一些新進展,但離徹底解決還很遠。
黎曼猜想不只是數學里的「腦洞」,它的研究還推動了很多數學分支的發展,比如復分析和數論的結合。