成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

“地表最強(qiáng)”Grok 3震撼登場,馬斯克演示卻“小翻車”,網(wǎng)友調(diào)侃:加上擎天柱才是AGI!幾個(gè)月后還將開源!

原創(chuàng) 精選
人工智能
為了訓(xùn)練,xAI 進(jìn)一步加大算力投入。據(jù)報(bào)道,馬斯克正為 xAI 籌集資金,以購買更多的 Nvidia GPU。最新消息是,xAI 正在進(jìn)行新一輪約 100 億美元(730 億元人民幣) 的融資,使公司估值達(dá)到約 750 億美元(5440 億元人民幣)。這個(gè)數(shù)值已經(jīng)接近OpenAI估值的一半。

出品 | 51CTO技術(shù)棧(微信號:blog51cto)

編輯 | 伊風(fēng)、言征

跳票多次!Grok 3終于來了!

此前,DeepSeek創(chuàng)造的破圈奇跡,把硅谷的大模型公司全部籠罩在陰影之下。

在Grok 3發(fā)布前,馬斯克也是信心滿滿地放話出去:Grok 3將成為地表最強(qiáng)AI。

“我們有信心Grok 3會(huì)比其他任何AI都強(qiáng),而且很有可能,再也不會(huì)有比Grok(系列)更強(qiáng)的AI了。”

上圖:馬斯克稱Grok 3是地球最聰明的AI上圖:馬斯克稱Grok 3是地球最聰明的AI

從性能上看,Grok比起現(xiàn)在各家的最強(qiáng)基礎(chǔ)模型,是有一定飛躍的。

圖片圖片

同時(shí),既然要做地表最強(qiáng),Grok 3肯定是要做思維鏈推理的。

在推理方面,Grok 3越過了最近才發(fā)的o3 mini,可以說是非常能打。

上圖:Grok與其他模型在數(shù)學(xué)、科學(xué)、編碼上的性能對比上圖:Grok與其他模型在數(shù)學(xué)、科學(xué)、編碼上的性能對比

不過,號稱最強(qiáng)的Grok 3演示卻翻車得很災(zāi)難。感覺沒學(xué)到DeepSeek R1的聰明勁,反而學(xué)到了“服務(wù)器繁忙,稍后重試”。

在這個(gè)演示里,團(tuán)隊(duì)成員讓Grok 3“使用 Pygame 制作一款融合了俄羅斯方塊(Tetris)和寶石迷陣(Bejeweled)元素的游戲。代碼可能會(huì)很長,請將代碼輸出為一個(gè)文件,并使其非常出色。(原Prompt翻譯)”

或許是這個(gè)題目太難,直接給Grok 3干冒煙了。多次思考未果后就退出,演示的成員多次點(diǎn)擊重試,最后停留在思考界面“切屏”了。

(視頻做了二倍速處理)(視頻做了二倍速處理)

不過好在,又過去一段時(shí)間后,Grok 3還是完成了該游戲的demo。

可以看到,AI正確理解了元素融合。游戲規(guī)則不再是一行就消除,而是幾個(gè)相同顏色的色塊碰到就能進(jìn)行消除了。而且俄羅斯方塊的色彩設(shè)計(jì)得很漂亮,可以稱得上是出色的應(yīng)用。

馬斯克此前就看好AI游戲,在直播中他透露會(huì)搞一個(gè)AI游戲社區(qū),由用戶發(fā)布與Grok的共創(chuàng)作品。

另一個(gè)長思維鏈的“秀肌肉”展示。則是與“火星殖民”計(jì)劃相關(guān)的,直接讓Grok 3出一段符合開普勒定律的天體模擬demo,為發(fā)射到火星的飛行器規(guī)劃軌跡。

可以看到下圖模擬了太陽、以及圍繞太陽公轉(zhuǎn)的地球和火星,并模擬了一個(gè)飛行器的路線。

從這里看出,Grok 3能思考相當(dāng)復(fù)雜的問題,能挑戰(zhàn)需要更長推理時(shí)間的問題。

美中不足的是,其演示不是直接讓我們看全程的推理,所以不確定有沒有“移花接木”的存在。

令一個(gè)讓人略感失望的事情,這次的模型發(fā)布也是期貨:Grok 3需要在X上訂閱,然后會(huì)陸續(xù)開放給X用戶。估計(jì)這個(gè)等待期大概是一周左右。

而Grok 3的API則要再延遲數(shù)周上線。同時(shí),幾周后的更新還會(huì)給Grok上線一個(gè)語音版本,使其變成用戶的個(gè)人助手。

另一個(gè)比較勁爆的消息是,馬斯克在答復(fù)觀眾提問的環(huán)節(jié)中宣布:幾個(gè)月以后將開源上一代Grok 2!

直播最后,馬斯克宣布,他也要做AI搜索了!感覺這個(gè)領(lǐng)域已經(jīng)成為必爭之地了。

下面是Grok深度搜索的界面,據(jù)馬斯克介紹說,自家產(chǎn)品的優(yōu)勢是在深度探索過程中,可以設(shè)計(jì)各種次任務(wù)(左側(cè)欄),讓整個(gè)搜索更加透明、結(jié)果更加可信。

圖片圖片

加了強(qiáng)推理之后,AI不止步于搜索,也能更好地做決策判斷。

在演示中,馬斯克讓AI搜索信息,預(yù)測星艦下一次的發(fā)射日期。當(dāng)星艦給出發(fā)射時(shí)間是2月24日或者更晚時(shí),馬斯克笑著說,差不多,可能是這樣吧。

另外插播一個(gè)Drama的事情,GPT 4.5也即將發(fā)布。

今天一早,奧特曼就發(fā)推炒作了一把:

“嘗試 GPT-4.5 對于那些高要求的測試者來說,比我預(yù)想的更像是一次“感受到 AGI”(通用人工智能)的時(shí)刻!”

還有人誘惑奧特曼趕在Grok發(fā)布之前用GPT 4.5截胡,奧特曼回復(fù):這不太好吧。。。

圖片圖片

有傳言稱,OpenAI的團(tuán)隊(duì)(包括奧特曼在內(nèi)),會(huì)聚在一起觀看Grok 3,然后再?zèng)Q定是否要推4.5出來。

那么,你認(rèn)為Grok這波能炸出GPT 4.5嗎?讓我們詳細(xì)看看“地表最強(qiáng)AI”的性能再下結(jié)論吧!

1.模型新霸主:性能、推理都登頂

Grok 3 的計(jì)算量比之前的初始模型高出大約十倍。于今年1 月才正式完成了預(yù)訓(xùn)練。

這樣大的訓(xùn)練量使得Grok 3摘得了大模型的王冠。

不只是性能方面的全面領(lǐng)先。

圖片圖片

xAI團(tuán)隊(duì)還給 Grok 3 進(jìn)行了多維度的評估,包括數(shù)學(xué)推理、科學(xué)常識(shí)以及計(jì)算機(jī)科學(xué)編程。

這次使用了美國數(shù)學(xué)邀請賽(AIME)2025的“新題”,可以看到Grok 3在各個(gè)領(lǐng)域的表現(xiàn)都極為出色。

圖片圖片

除了在基準(zhǔn)測試中的領(lǐng)先,在實(shí)際應(yīng)用中也有亮眼的成績。

xAI團(tuán)隊(duì)對Grok 3啟動(dòng)了盲測,代號為“熱巧克力”,在名為 Chaartrina 的平臺(tái)上運(yùn)行了兩周。這個(gè)平臺(tái)完全剝離了產(chǎn)品的外殼,只對這些 AI 語言模型本身進(jìn)行純粹的比較。用戶提交問題后,會(huì)看到兩個(gè)回答,但不知道這些回答來自哪個(gè)模型,然后進(jìn)行選擇。

在盲測中,Grok 3 的表現(xiàn)非常出色,其綜合評分達(dá)到了 1400 分,沒有其他模型能達(dá)到這樣的分?jǐn)?shù)。

2.大手筆的訓(xùn)練:Grok 3的實(shí)力,來自馬斯克的鈔能力

Grok 3 的開發(fā)得益于其 Colossus 超級計(jì)算機(jī)的強(qiáng)大算力,該系統(tǒng)僅用了 8 個(gè)月就完成構(gòu)建。

Colossus 由 100,000 塊 Nvidia H100 GPU 提供支持(后又?jǐn)U展一倍,增至200000塊),為訓(xùn)練提供了 2 億 GPU 小時(shí)——比其前代模型 Grok 2 多 10 倍。

圖片圖片

馬斯克還在直播中爆料說,他們重構(gòu)了整個(gè)數(shù)據(jù)中心,并率先實(shí)現(xiàn)了數(shù)據(jù)中心的液冷。為了給數(shù)據(jù)中心供能、節(jié)能,xAI的團(tuán)隊(duì)重新設(shè)計(jì)了一個(gè)新的能源設(shè)計(jì)算法,最大程度地減少能耗。

這一計(jì)算資源的顯著提升,使 Grok 3 能夠更高效地處理大規(guī)模數(shù)據(jù)集,從而縮短訓(xùn)練時(shí)間并提高準(zhǔn)確性。

在具體的訓(xùn)練技術(shù)上,Grok 3有這幾個(gè)重點(diǎn):

  • 合成數(shù)據(jù)集(Synthetic Datasets)——以人工生成的數(shù)據(jù)集為重點(diǎn),而非從真實(shí)世界收集的數(shù)據(jù)。這些數(shù)據(jù)集可以模擬各種場景,確保數(shù)據(jù)的多樣性和可控性,從而提高學(xué)習(xí)效率,并在一定程度上解決數(shù)據(jù)隱私問題。
  • 人類反饋循環(huán)(Human Feedback Loops):由人工審核并提供反饋,幫助 AI 持續(xù)優(yōu)化回答的準(zhǔn)確性和相關(guān)性。
  • 自我糾錯(cuò)機(jī)制(Self-Correction Mechanisms)——這是一種 AI 技術(shù),使模型能夠識(shí)別并糾正自身錯(cuò)誤。通過評估其輸出結(jié)果,并與已知的正確答案進(jìn)行比較,模型可以不斷優(yōu)化自身回答,減少錯(cuò)誤,提高準(zhǔn)確性。

因此,Grok 3是能持續(xù)進(jìn)化的模型,就像馬斯克在直播中說“目前,每天都在更新這個(gè)模型”。

圖片圖片

有網(wǎng)友看罷驚呼:擎天柱加持Grok-3,AGI感覺真的要來了!

3.寫在最后:開源、發(fā)GPT4.5,OpenAI來勢洶洶

Grok 3 多次跳票,終于以第一名的頭銜回歸。

Grok 3的算力消耗達(dá)到了DeepSeek V3的幾百倍之多。這也提醒我們,在DeepSeek創(chuàng)造的低成本奇跡之后,基礎(chǔ)模型的規(guī)模和算力競爭仍在繼續(xù)。

為了訓(xùn)練,xAI 進(jìn)一步加大算力投入。據(jù)報(bào)道,馬斯克正為 xAI 籌集資金,以購買更多的 Nvidia GPU。最新消息是,xAI 正在進(jìn)行新一輪約 100 億美元(730 億元人民幣) 的融資,使公司估值達(dá)到約 750 億美元(5440 億元人民幣)。這個(gè)數(shù)值已經(jīng)接近OpenAI估值的一半。

現(xiàn)在,馬斯克的地表最強(qiáng)AI名副其實(shí),Grok 3 在訓(xùn)練上的瘋狂投入,使其在 AI 領(lǐng)域的競爭力再次攀升。

有趣的是,要和“CloseAI”打擂臺(tái)的Grok,最初是以開源形象亮相的。然而在Grok-1.5 以后,Grok就轉(zhuǎn)變?yōu)榱送耆拈]源模型。

直到DeepSeek廣泛出圈,馬斯克才舊事重提,宣布Grok 2幾個(gè)月后將開源!

無獨(dú)有偶,馬斯克的老冤家——曾在DeepSeek爆紅后表示“站在開閉源錯(cuò)誤一端”的奧特曼,也重新提起了開源項(xiàng)目這一茬。

「對于我們的下一個(gè)開源項(xiàng)目,我們應(yīng)當(dāng)選擇開發(fā)一個(gè)雖然體積小但仍然需要借助 GPU 運(yùn)行的 o3 mini 層級模型,還是應(yīng)當(dāng)致力于開發(fā)一個(gè)尺寸適合手機(jī)且表現(xiàn)最佳的模型呢?」

此外,Altman 還發(fā)起了投票。截至發(fā)稿前,端側(cè)模型的投票率大幅領(lǐng)先,相比于o3 mini 的開源,顯然高贊評論的網(wǎng)友更希望開源GPT-4。

圖片圖片

Altman 曾在本月初公開承認(rèn)OpenAl的閉源策略站在了歷史錯(cuò)誤的一邊。不僅讓人感慨AI圈的時(shí)間流速之快。

在如此高強(qiáng)度的競爭之下,我們不禁要問:GPT 4.5發(fā)布在即,Grok的王冠又能維持多久呢?

參考鏈接:

1.https://www.forbes.com/sites/larsdaniel/2025/02/16/elon-musks-scary-smart-grok-3-release--what-you-need-to-know/

2.https://www.ndtv.com/world-news/all-you-need-to-know-about-xai-chatbot-grok-3-releasing-today-7730644

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2024-02-01 15:01:46

AI模型

2022-09-01 14:54:18

機(jī)器人人工智能自動(dòng)駕駛

2025-02-18 15:09:07

2024-01-16 08:34:38

擎天柱機(jī)器人人工智能

2025-01-03 15:42:59

AI模型數(shù)據(jù)

2024-06-11 07:30:00

2024-03-18 14:17:06

大模型開源人工智能

2025-02-18 14:59:16

2011-10-12 10:44:24

惠普DL980關(guān)鍵業(yè)務(wù)

2025-06-30 09:03:00

2024-03-18 15:00:48

Grok現(xiàn)已開源Grok-1混合專家模型

2023-12-13 08:46:33

人工智能ChatGPT機(jī)器人

2024-03-12 13:14:40

2025-02-21 10:51:47

2025-03-03 12:59:39

2023-11-06 13:44:34

2024-04-15 12:52:00

AI數(shù)據(jù)

2024-03-18 13:21:13

2024-07-23 20:37:06

2024-01-16 12:43:00

機(jī)器人AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲麻豆| 黄色网址av | 日韩在线播放第一页 | 久久中文一区二区 | 91国内精精品久久久久久婷婷 | 国产精品99视频 | 成人国产一区二区三区精品麻豆 | 亚洲国产成人精品女人久久久野战 | 国产精品久久国产精品 | 久久精品国产一区 | 欧美日韩国产精品一区 | 日韩一区二区三区视频 | 日韩成人精品在线 | 精品一区二区三区在线播放 | av在线免费观看网站 | 四虎成人精品永久免费av九九 | 日韩伦理一区二区三区 | 日本涩涩网 | 免费久久久 | 免费性视频| 黄色大片免费网站 | 久久精品国产99国产精品亚洲 | 欧美精品一区二区三区在线播放 | 欧美精品a∨在线观看不卡 国产精品久久国产精品 | 久久国产欧美日韩精品 | 午夜视频免费在线观看 | 手机av在线| 日韩波多野结衣 | 日韩精品一区二区不卡 | japanhd美女动 | 看真人视频一级毛片 | 精品日韩一区二区三区av动图 | 国产欧美精品一区二区 | 毛片片| 九九av | www.成人.com | 99久久精品一区二区成人 | 日韩在线视频网址 | 天天色av | 日本精品视频 | 成年免费大片黄在线观看一级 |