成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<table id="igjau"></table><ruby id="igjau"><del id="igjau"></del></ruby>

<th id="igjau"><meter id="igjau"><span id="igjau"></span></meter></th>

<s id="igjau"><source id="igjau"></source></s>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！原創(chuàng)

51CTO技術(shù)棧

發(fā)布于 2025-7-10 15:53

瀏覽

0收藏

編輯 | 伊風(fēng)

馬斯克，又雙叒叕意料之中地遲到了。

Grok 4 原定的直播足足晚了一個(gè)小時(shí)，馬老板終于姍姍來遲，開始了這場發(fā)布會。

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

更加推遲上線的，則是大家原以為會同步上線的編程模型 Grok 4 Code —— 直接鴿到下個(gè)月發(fā)布，讓人有些小失望。

不過，接下來的幾個(gè)月，xAI 還將陸續(xù)推出一款多模態(tài)智能體，以及一款具備視頻理解與生成能力的綜合模型?？梢哉f從7月到10月，Grok 4家族都持續(xù)有大動作出來，值得期待。

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

回到這場直播，Grok 4 成為了絕對的主角。

本次共發(fā)布兩款模型：

Grok 4
Grok 4 Heavy：xAI 稱其為“多智能體版本”，多個(gè) Grok 4 協(xié)同工作，性能進(jìn)一步提升。

“Grok 4 是全球最強(qiáng)大的 AI 模型?！?/p>

馬斯克在直播中說：“它在所有學(xué)科上的學(xué)術(shù)水平都超過博士，無一例外。如果到明年 Grok 還沒發(fā)現(xiàn)點(diǎn)新的科學(xué)知識，我會感到很驚訝。”

Grok 4 Heavy 在列出的各項(xiàng)學(xué)術(shù)基準(zhǔn)測試中全面登頂，拿下 SOTA。

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

價(jià)格也拉開了差距：

普通版（Grok 4）為每月 30 美元
超大杯（Grok 4 Heavy）則高達(dá) 每月 300 美元！

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

整場直播的演示環(huán)節(jié)不像上次Grok 3的發(fā)布如此密集。

但仍然有些“整活”環(huán)節(jié)，讓人印象十分深刻！首先，就是為了展示Grok的語音交互能力，直接在直播里“拉踩”了OpenAI的4o，從下面這個(gè)演示里可以看到Grok的助手“伊芙”反應(yīng)更迅速、語氣更自然。

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū)

而另一個(gè)點(diǎn)，則是此前Grok 3發(fā)布時(shí)馬斯克就心心念念的AI手搓電子游戲。

到了Grok 4 AI已經(jīng)做的非常像模像樣了，馬斯克預(yù)計(jì)明年就有成熟的大型游戲能跑出來：

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

1.碾壓一切的基準(zhǔn)成績——這不就是 AGI？

當(dāng) Grok 4 的基準(zhǔn)成績鋪天蓋地刷屏后，網(wǎng)友們幾乎給出了統(tǒng)一的結(jié)論：

這不就略等于是 AGI了嗎？

從官方發(fā)布的測試結(jié)果來看，Grok 4 在多個(gè)標(biāo)桿級任務(wù)中全面碾壓對手，毫無懸念地登頂各項(xiàng)榜單，成為當(dāng)前最強(qiáng)的 SOTA 模型。

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

比如在 AI 社區(qū)關(guān)注的 Artificial Analysis 綜合測評中，Grok 從上代的 67 分，躍升至 73 分，實(shí)現(xiàn)了明顯的跨代突破。

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

而在ARC-AGI基準(zhǔn)中，Grok 4也直接飛升，將一眾對手遠(yuǎn)遠(yuǎn)甩在后面。

這項(xiàng)測試的難度在于，它不是傳統(tǒng)的問答題，而是要求 AI 具備圖形推理、模式識別等“類人類直覺”能力，被視為檢驗(yàn)“是否具備 AGI 潛力”的試金石。

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

而在外界稱為“人類最后一場考試”（Humanity’s Last Exam）的評估中，Grok 4 Heavy 更是以 44.4% 的高分拔得頭籌，遠(yuǎn)超 Gemini 和 OpenAI 的 o3 模型。

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

甚至在 Claude 曾參與過的“售貨機(jī)模擬商戰(zhàn)”實(shí)驗(yàn)中，Grok 也橫空出世，成為最會賺錢的 AI 商人：

最終凈利潤是 Claude 的兩倍多
執(zhí)行時(shí)長更長

之所以有這么出色的戰(zhàn)績，是因?yàn)镚rok 4能有效地制定策略，并在長時(shí)間內(nèi)保持一致性。

他們還提了一個(gè)超級瘋狂的計(jì)劃：如果有辦法把GPU的成本打下來。就可以嘗試搞一百萬臺自動售貨機(jī)，然后穩(wěn)穩(wěn)賺47億美元。。。

值得一提的是，Grok 4和Claude 4都超過了人類的經(jīng)商水平。

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

不過，面對如此夢幻的數(shù)據(jù)，我們也不能全然“上頭”，還是可以潑一點(diǎn)冷水：

首先，官方數(shù)據(jù)可能具備一些水分。例如，據(jù)此前披露，Grok 3 的部分成績采用了consensus@64”的方式，也就是一題跑 64 次，挑最好的結(jié)果出來展示——而對比模型則大多是“一次跑完”的標(biāo)準(zhǔn)流程，這顯然是個(gè)有些討巧的“刷榜”策略。

所以，Grok 4 的實(shí)際能力還需要權(quán)威的獨(dú)立榜單來進(jìn)一步驗(yàn)證，建議大家蹲蹲民間榜單，綜合評估。

此外，這次 Grok 4 能打得這么猛，也離不開一個(gè)“外掛”：

它已經(jīng)掌握了調(diào)用工具（tools）的能力 —— 不再是光靠語言模型硬算，而是能外接計(jì)算器、搜索器、甚至模擬瀏覽網(wǎng)頁?？磥恚Ｐ图碅gent也是一個(gè)大趨勢。

2.訓(xùn)練飛躍：首次在訓(xùn)練階段引入工具使用

在 Grok 4 的訓(xùn)練過程中，xAI 做出了一項(xiàng)意義重大的突破：首次在訓(xùn)練階段就引入了工具使用機(jī)制。不再僅依賴語言模型自身的泛化能力，而是讓模型從一開始就學(xué)會如何調(diào)用搜索引擎、計(jì)算器等外部工具來完成任務(wù)。

這不僅是方法上的革新，更帶來了量級上的性能飛躍。

這個(gè)操作到底有多猛？看看下面這張圖就懂了——

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

可以說，在“工具使用”這件事上，Grok 4 的可靠性和表現(xiàn)已經(jīng)把前幾代模型遠(yuǎn)遠(yuǎn)甩在身后。

而且，也有眼尖的網(wǎng)友發(fā)現(xiàn)，Grok 4 heavy之后，性能還有上升空間。據(jù)爆料說，xAI內(nèi)部還有更強(qiáng)的模型因?yàn)槌杀締栴}沒有發(fā)布！

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

不過，團(tuán)隊(duì)也坦言，目前 Grok 使用的工具仍然比較原始。如果拿它與 Tesla 或 SpaceX 等工業(yè)場景中的工程工具相比，比如精密的物理模擬和有限元分析系統(tǒng)，它還遠(yuǎn)遠(yuǎn)不夠。但馬斯克明確表示，今年晚些時(shí)候，xAI 將為 Grok 接入這些“真正的商業(yè)級工具鏈”，讓它具備解決現(xiàn)實(shí)科技問題的能力。

而馬斯克也提出，終極形態(tài)是將 Grok 與 Optimus（人形機(jī)器人）結(jié)合，實(shí)現(xiàn) AI 主動感知并操作現(xiàn)實(shí)世界。

一旦模型擁有了物理交互能力，它就可以自己“動手試驗(yàn)”、修正假設(shè)、驗(yàn)證反饋。換句話說，AI 不只是坐在云端思考，而是走進(jìn)現(xiàn)實(shí)世界動手改造它。這將給整個(gè) AI 硬件生態(tài)帶來顛覆性的沖擊。

在Grok他們看來，通向 AGI 的路徑，已經(jīng)不再是“算力夠不夠”這么簡單的問題，而是一個(gè)“算力 + 工具 + 實(shí)體交互能力”三位一體的大模型工程。

而馬斯克也展望說一旦AI具備了該項(xiàng)能力，將引爆一個(gè)數(shù)千倍甚至百萬倍規(guī)模的新經(jīng)濟(jì)體。

3.寫在最后：Gemini 3、GPT-5都在路上了

雖然 Grok 4 的發(fā)布引發(fā)熱議，但戰(zhàn)局遠(yuǎn)未塵埃落定。

據(jù)X上的網(wǎng)友爆料，Gemini 3 很快就要登場了。谷歌最近的迭代速度真的既快又狠，眼見要成為領(lǐng)跑者了。

訂閱費(fèi)300刀，值嗎？馬斯克發(fā)布Grok 4登頂SOTA！一項(xiàng)突破上大分：訓(xùn)練階段就教AI用工具！-AI.x社區(qū) 圖片

而根據(jù)奧特曼此前的透露，GPT-5 將在今夏發(fā)布，照這個(gè)節(jié)奏，接下來一到兩個(gè)月內(nèi)，大模型圈還會有更多炸點(diǎn)。

有網(wǎng)友說得很形象：

“哪有什么AI撞墻期？根本看不到墻在哪里！”

你看好今天發(fā)布的Grok 4嗎？

或者，你覺得下個(gè)最令人期待的大模型會是哪一家推出的？評論區(qū)聊聊你的觀點(diǎn)。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??，作者：伊風(fēng)

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

社區(qū)頭條

回復(fù)

相關(guān)推薦

馬斯克的 Grok AI 開源

jiecho ? 6558瀏覽 ? 0回復(fù)
馬斯克跟甲骨文談崩了，百億大訂單泡湯！馬斯克欲買30萬臺B200,嫌棄甲骨文速度太慢！對方：根本沒那么多電

51CTO技術(shù)棧 ? 3359瀏覽 ? 0回復(fù)
馬斯克突發(fā)新版大模型，犧牲特斯拉資源叫板OpenAI，Grok-2一手實(shí)測來了

Crystalcxt ? 2333瀏覽 ? 0回復(fù)
OpenAI被黑客入侵，發(fā)布虛假加密Token激勵(lì)，首席科學(xué)家、首席技術(shù)官紛紛中招，馬斯克也在入侵名單

51CTO技術(shù)棧 ? 2940瀏覽 ? 0回復(fù)
發(fā)布會上特斯拉Optimus竟是人扮演的？時(shí)薪高達(dá)48美元！馬斯克人形機(jī)器人的預(yù)言會想星艦一樣成功嗎？

51CTO技術(shù)棧 ? 2760瀏覽 ? 0回復(fù)
DuQuant：通過正交變換分散 LLM 離群值，實(shí)現(xiàn) SOTA 4bit 量化

amei2000go ? 3722瀏覽 ? 0回復(fù)
一項(xiàng)發(fā)人深省的研究

芝士AI吃魚 ? 3086瀏覽 ? 0回復(fù)
馬斯克明顯是個(gè)惡霸！不會完全放棄非營利性質(zhì)！奧特曼罕見采訪曝猛料：馬斯克喜歡到處干架

51CTO技術(shù)棧 ? 2318瀏覽 ? 0回復(fù)
馬斯克又又又跳票了！說好年底推出的“重大飛躍”的Grok 3，遲遲未現(xiàn)身！

51CTO技術(shù)棧 ? 2291瀏覽 ? 0回復(fù)
馬斯克再開炮：974億美元買下OpenAI！馬斯克與奧特曼的恩怨局如何收場？

51CTO技術(shù)棧 ? 1928瀏覽 ? 0回復(fù)
“地表最強(qiáng)”Grok 3震撼登場，馬斯克演示卻“小翻車”，網(wǎng)友調(diào)侃：加上擎天柱才是AGI！幾個(gè)月后還將開源！

51CTO技術(shù)棧 ? 2563瀏覽 ? 0回復(fù)
AI領(lǐng)域的“新王”誕生! 馬斯克發(fā)布Grok 3，趕超OpenAI o1和Deepseek R1！

AI博物院 ? 2280瀏覽 ? 0回復(fù)
馬斯克連夜官宣Grok 3：這8個(gè)功能讓程序員集體失業(yè)

Halo咯咯 ? 3125瀏覽 ? 0回復(fù)
馬斯克最新預(yù)言：AI毀滅世界的概率為20%！星艦全程復(fù)用后成本將砍99%！

51CTO技術(shù)棧 ? 2751瀏覽 ? 0回復(fù)
馬斯克宣布回歸：搞DOGE不如搞AI!用第一性原理搞定萬卡集群搭建；Grok 3.5重點(diǎn)搞推理！

51CTO技術(shù)棧 ? 745瀏覽 ? 0回復(fù)
全球最聰明AI誕生！Grok 4 擊潰所有模型，馬斯克20萬GPU訓(xùn)練出最貴AI

算家計(jì)算 ? 1586瀏覽 ? 0回復(fù)
馬斯克Grok 4陷入爭議！追求真理還是個(gè)人觀點(diǎn)的「擴(kuò)音器」？

算家計(jì)算 ? 1058瀏覽 ? 0回復(fù)
馬斯克發(fā)布Grok-4，性能碾壓Claude 4兩倍！

探索AGI ? 1918瀏覽 ? 0回復(fù)
馬斯克又大嘴了！Grok 4 真實(shí)水平曝光，多項(xiàng)實(shí)測翻車，連前端都搞不定，還談什么AGI？網(wǎng)友怒評：上當(dāng)了，花

51CTO技術(shù)棧 ? 718瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

從播客到帶娃，看老黃、納德拉、奧特曼這些CEO 如何在生活中使用 AI 0回復(fù)

Cursor公開致歉！我們定價(jià)不清，愿意全額退款！迷惑的Pro定價(jià)終于被解釋！ 0回復(fù)

又顛覆了！Vidu Q1新功能太炸裂了，打破原有AI視頻制作流程，零分鏡、素材即劇組，小白2分鐘搞定大片！ 0回復(fù)

重磅！英偉達(dá)宣布H20芯片即將恢復(fù)對華銷售，并計(jì)劃推出全新GPU 0回復(fù)

我把DeepSeek微調(diào)參數(shù)扒光了，顯存和性能優(yōu)化的秘密都在這 0回復(fù)

上一篇：免費(fèi)！快Claude十倍！一秒1000個(gè)token！硅谷創(chuàng)業(yè)公司新推編程神器炸翻了！

下一篇： AI終極用法！ChatGPT誤導(dǎo)功能開發(fā)！整個(gè)團(tuán)隊(duì)懵逼尬住，知名開源大佬創(chuàng)始人被AI逼宮成功：開發(fā)邏輯變了！

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：婷婷久久久久 | 国产精品视频综合 | 九九久久精品 | 香蕉久久久 | 日日摸夜夜添夜夜添精品视频 | 免费观看一级毛片 | 伊人网在线播放 | 国产精品永久免费视频 | 日韩在线视频精品 | 色婷婷综合久久久中字幕精品久久 | 蜜桃视频一区二区三区 | 夜夜操操操 | 成人在线免费视频 | 龙珠z国语版在线观看 | 日韩有码在线观看 | 国产美女黄色片 | 成人视屏在线观看 | 日韩在线观看 | 成人午夜视频在线观看 | 久久r免费视频 | 欧美日韩亚洲三区 | 国产欧美精品区一区二区三区 | 成人免费视频久久 | 成人小视频在线观看 | 性色网站 | 中文字幕在线观看国产 | 国产欧美日韩一区 | 久精品久久 | 日本a在线| 国产精品毛片久久久久久久 | 99精品视频在线 | 成人av在线播放 | 国产又色又爽又黄又免费 | 久久久毛片| 国产精品黄色 | 免费在线一区二区 | 精品国产一区二区三区性色av | 欧美精| 99久久久无码国产精品 | 日日操av | 在线看片福利 |