AI盈利難、機(jī)器人泡沫多！馬庫(kù)斯25年AI預(yù)測(cè)，隔空喊話?cǎi)R斯克

作者：新智元 2025-01-21 13:21:45

新年伊始，AI專家Gary Marcus發(fā)布長(zhǎng)文，公布了他對(duì)2025年AI發(fā)展最新的25項(xiàng)預(yù)測(cè)，包括AGI、生成式AI、自動(dòng)駕駛、人形機(jī)器人、視頻生成、智能體等多個(gè)方向。雖然在2024年對(duì)OpenAI估值預(yù)測(cè)出錯(cuò)，但在最新的預(yù)測(cè)中仍不看好OpenAI。

去年，馬庫(kù)斯對(duì)于AI趨勢(shì)的預(yù)測(cè)幾乎全部正確，但完全沒(méi)想到OpenAI可以估值到1500億美元。

在本月2日，馬庫(kù)斯發(fā)表了對(duì)2025年的25個(gè)AI預(yù)測(cè)，涵蓋AGI、GenAI、自動(dòng)駕駛、人形機(jī)器人、智能體等多個(gè)方向。

馬斯克（Elon Musk），曾預(yù)測(cè)2025年底的AI能力：「我們就會(huì)擁有比任何人都聰明的AI」。

馬庫(kù)斯對(duì)此并不認(rèn)同，主要預(yù)測(cè)內(nèi)容如下：

1. 反對(duì)馬斯克的預(yù)言，到2025年底不會(huì)出現(xiàn)強(qiáng)人工智能。

2. GenAI的可靠性、推理、幻覺(jué)、能耗等問(wèn)題得不到根本的解決。

3. 智能體和類人機(jī)器人在2025年會(huì)得到大量宣傳，但應(yīng)用有限。

4. AI模型盈利難，估值開始下滑；OpenAI市場(chǎng)表現(xiàn)不佳；自動(dòng)駕駛難落地。

對(duì)2025年的25項(xiàng)預(yù)測(cè)

高置信度預(yù)測(cè)

1 通用人工智能（AGI）不會(huì)在2025年實(shí)現(xiàn)。（可能會(huì)有人通過(guò)弱化定義甚至用經(jīng)濟(jì)標(biāo)準(zhǔn)重新定義AGI來(lái)試圖混淆概念。）

2 到2025年底，沒(méi)有任何單一系統(tǒng)能可靠解決四項(xiàng)以上的Marcus-Brundage的AI 2027任務(wù)，甚至可能沒(méi)有任何任務(wù)被完全解決。

3 AI模型的盈利將繼續(xù)保持在中等偏下水平甚至可能不復(fù)存在（芯片制造公司如NVIDIA在供應(yīng)硬件方面會(huì)繼續(xù)表現(xiàn)優(yōu)異，但模型開發(fā)公司在這場(chǎng)「淘金熱」中只能充當(dāng)「賣鏟子」的角色）。

4 美國(guó)幾乎不會(huì)有實(shí)質(zhì)性法規(guī)出臺(tái)，消費(fèi)者仍面臨GenAI帶來(lái)的風(fēng)險(xiǎn)。全球其他地區(qū)在法規(guī)制定上會(huì)越來(lái)越參考?xì)W洲的做法。

5 國(guó)家AI安全研究所將提供指導(dǎo)，但它們對(duì)危險(xiǎn)模型的約束力將非常有限。

6 GenAI的可靠性問(wèn)題將在2025年持續(xù)存在。

7「幻覺(jué)」現(xiàn)象（即生成內(nèi)容中的虛構(gòu)敘述）問(wèn)題將繼續(xù)困擾GenAI。

8 推理能力的不足仍將繼續(xù)困擾GenAI。

9 AI「智能體」將在2025年被廣泛宣傳，但在除了一些非常狹窄的應(yīng)用場(chǎng)景外，仍然難以實(shí)現(xiàn)可靠性。

10 類人機(jī)器人將受到大量宣傳，但不會(huì)有產(chǎn)品能夠接近The Jetsons中「Rosie機(jī)器人」的能力。盡管運(yùn)動(dòng)控制可能表現(xiàn)優(yōu)異，但場(chǎng)景意識(shí)和認(rèn)知靈活性仍然不足。

The Jetsons中的機(jī)器人Rosie

11 OpenAI將繼續(xù)提前數(shù)月甚至數(shù)年預(yù)覽產(chǎn)品，但正式推出和廣泛可用仍需較長(zhǎng)時(shí)間。（例如，Sora于2024年2月預(yù)覽，直到12月才正式發(fā)布，且受到使用限制；Sal Khan在2024年5月演示的AI家庭教師仍未普及；o3 已進(jìn)行了預(yù)覽，但尚未發(fā)布，其價(jià)格可能相當(dāng)昂貴。）

12 與2016年Hinton的預(yù)測(cè)相反，很少有放射科醫(yī)生會(huì)被AI替代。

13 真正的無(wú)人駕駛汽車（無(wú)需人類參與交通）仍將限制在少數(shù)城市，且在天氣良好的條件下。人類駕駛員仍將在經(jīng)濟(jì)中占很大比重。

14 GenAI的版權(quán)相關(guān)訴訟將在2025年持續(xù)不斷。

15 AI模型的能耗將上升并會(huì)成為一個(gè)主要問(wèn)題，但很少有GenAI公司會(huì)公開用電量。

16 被AI替代的勞動(dòng)力比例將少于10%，可能少于5%。商業(yè)藝術(shù)家和配音演員可能受到最大的影響。（當(dāng)然，隨著人們開始使用新工具，許多工作也會(huì)隨之改變。）

17 馬庫(kù)斯依然堅(jiān)持關(guān)于o3的預(yù)測(cè)，即一開始人們會(huì)感到驚奇，然而一旦深入探究就會(huì)發(fā)現(xiàn)o3不可靠；o3在封閉領(lǐng)域（比如數(shù)學(xué)）表現(xiàn)最佳，而在開放領(lǐng)域（比如關(guān)于真實(shí)世界的日常推理）表現(xiàn)欠佳。

中等置信度預(yù)測(cè)

18 技術(shù)「護(hù)城河」仍然難以建立。相反，中美兩國(guó)將趨同到大體相似的AI模型；歐洲的部分系統(tǒng)也將趕上大致相同的位置。

19 由于價(jià)格及其穩(wěn)定性與價(jià)格不匹配的原因，很少有公司（更不要提更少的消費(fèi)者）會(huì)大規(guī)模采用o3。

20 公司將繼續(xù)嘗試使用AI，但將其全面采用為生產(chǎn)級(jí)系統(tǒng)并在現(xiàn)實(shí)世界中大規(guī)模部署的態(tài)度仍然會(huì)非常謹(jǐn)慎。

21 2025年可能成為AI大公司估值開始下滑的一年。（盡管正如那句名言所說(shuō)，「市場(chǎng)的非理性比你的償付能力持續(xù)得更久。」）

22 Sora在物理學(xué)領(lǐng)域?qū)⒗^續(xù)表現(xiàn)不佳。（谷歌的Veo 2看起來(lái)似乎有所改進(jìn)，但由于尚未親自測(cè)試，仍然懷疑其在狀態(tài)變化和對(duì)象持久性上的問(wèn)題。另一種尚未完全發(fā)布的基于不同原理的混合系統(tǒng)，稱為Genesis，看起來(lái)可能很有前景。）

23 神經(jīng)符號(hào)AI的影響力將在2025年顯著增加。

低置信度預(yù)測(cè)，但值得討論

24 我們很可能會(huì)看到GenAI在大規(guī)模網(wǎng)絡(luò)攻擊中扮演重要的重要角色。馬庫(kù)斯將在Politico中發(fā)表一篇短文，討論可能的4種方式。

25 到2025年底，可能仍然不會(huì)出現(xiàn)「GPT-5級(jí)別」的模型（即通過(guò)社區(qū)共識(shí)認(rèn)為在各方面實(shí)現(xiàn)重大飛躍的模型）。相反，我們可能會(huì)看到像o1這樣的模型，它在許多可生成高質(zhì)量合成數(shù)據(jù)的任務(wù)中表現(xiàn)良好，但在其他領(lǐng)域僅比GPT-4有小幅改進(jìn)。

2024年的預(yù)測(cè)回顧

總的來(lái)說(shuō)，馬庫(kù)斯對(duì)2024年預(yù)測(cè)盡管存在一些需要注意的地方，但大體上得到了驗(yàn)證。

核心預(yù)測(cè)

在2024年3月，馬庫(kù)斯發(fā)帖總結(jié)了對(duì)2024年的最核心的預(yù)測(cè)。

唯一的例外可能是OpenAI的o3，它在去年12月宣布，但至今未發(fā)布，也未接受廣泛的審查。

除此之外，所有七條預(yù)測(cè)基本上都非常接近預(yù)期。

2024年的現(xiàn)實(shí)情況：

我們目前仍然處于GPT-4級(jí)別階段，這些模型只是做了些許漸進(jìn)性的改動(dòng)，沒(méi)有一個(gè)值得OpenAI冠以GPT-5之名。
如今有許多類似的模型，市場(chǎng)上充斥著價(jià)格戰(zhàn)，幾乎沒(méi)有護(hù)城河。
幻覺(jué)問(wèn)題依然沒(méi)有得到有效解決。
企業(yè)級(jí)的采用遠(yuǎn)不如大多數(shù)人原本預(yù)期的那樣廣泛，所有公司的總體利潤(rùn)（當(dāng)然，硬件公司如英偉達(dá)除外，它們通過(guò)銷售芯片而非AI模型獲利）也充其量只是中等偏下水平的增長(zhǎng)。
到目前為止，參與的許多公司都在虧損，雖然至少有三家公司被半收購(gòu)，而它們?yōu)橥顿Y者帶來(lái)的利潤(rùn)極為有限。
2024年最重大的AI事件并不是大家期待已久的GPT-5發(fā)布，盡管粉絲們整年都在預(yù)測(cè)它的到來(lái)，但它始終未曾出現(xiàn)。

2024年的其他預(yù)測(cè)

馬庫(kù)斯從2022年開始，就預(yù)言單純依靠擴(kuò)展大語(yǔ)言模型 (LLM) 的方法最終會(huì)走到盡頭，在2024年11月和12月業(yè)內(nèi)人士的評(píng)論似乎驗(yàn)證了這一預(yù)測(cè)。

馬庫(kù)斯在2022年提出的「scaling law」并非物理定律，而是具有有限生命周期的泛化規(guī)則的觀點(diǎn)，在最近幾個(gè)月得到了廣泛傳播。

馬庫(kù)斯提出的「AI碰壁」（hitting a wall）這一概念在CNN、《The Verge》和《華爾街日?qǐng)?bào)》等媒體中也得到廣泛報(bào)道。

馬庫(kù)斯關(guān)于「擴(kuò)展scaling與收益遞減」的觀點(diǎn)和相關(guān)術(shù)語(yǔ)已逐漸普及。

馬庫(kù)斯在2022年，以及早在2001年出版的《The algebraic mind》一書中提出的具體弱點(diǎn)（如組合性、事實(shí)性和推理能力等）依然存在。盡管這些問(wèn)題或許會(huì)在未來(lái)得到解決，但當(dāng)前的技術(shù)手段顯然不夠。

馬庫(kù)斯在1998年、1999年和2001年，以及之后多次強(qiáng)調(diào)的分布漂移（distribution shift）問(wèn)題，在最近的研究中得到了多次印證，例如蘋果公司的關(guān)于推理的著名論文。

論文鏈接：https://arxiv.org/pdf/2410.05229

在2022年12月，馬庫(kù)斯預(yù)測(cè)的聊天機(jī)器人導(dǎo)致死亡的事件。

在2023年，該預(yù)言不幸得到了證實(shí)，而2024年似乎又出現(xiàn)了類似案例。

關(guān)于AI生成錯(cuò)誤信息，馬庫(kù)斯的警告正在逐步成為現(xiàn)實(shí)，盡管到目前為止，其影響比最初擔(dān)憂的要輕。但馬庫(kù)斯仍然感到擔(dān)憂，并認(rèn)為需要保持警惕。

在2023年2月，馬庫(kù)斯提出的關(guān)于GenAI破壞互聯(lián)網(wǎng)的警告，越來(lái)越顯得正確。

馬庫(kù)斯在2022年11月預(yù)測(cè)，LLM不會(huì)立即顯著改善如亞馬遜Alexa等商業(yè)AI智能體，這一預(yù)測(cè)在2024年仍然成立。

馬庫(kù)斯預(yù)測(cè)2024年會(huì)被視為「AI 幻滅之年」。這一說(shuō)法可能有些夸大，但對(duì)部分人來(lái)說(shuō)卻是事實(shí)。雖然許多人仍然對(duì)AI熱情不減，但也有不少人大失所望。例如，《華爾街日?qǐng)?bào)》報(bào)道：「微軟AI機(jī)器人的早期采用者懷疑其是否物有所值」。

馬庫(kù)斯在2023年關(guān)于OpenAI可能被視為AI界WeWork的預(yù)測(cè)尚未得到驗(yàn)證，但OpenAI的處境仍不樂(lè)觀。

OpenAI尚未盈利，預(yù)計(jì)至少到2029年之前都不會(huì)盈利，其消耗資金的速度以十億美元計(jì)，且仍缺乏明確的技術(shù)護(hù)城河。從長(zhǎng)期來(lái)看，特別是在高估值情況下，安全性仍然不確定。記者Ed Zitron和經(jīng)濟(jì)學(xué)家Brad DeLong等人也越來(lái)越多地表達(dá)了類似觀點(diǎn)。

關(guān)于生成式A技術(shù)和經(jīng)濟(jì)限制的預(yù)測(cè)大體正確，但馬庫(kù)斯對(duì)投資者的判斷完全錯(cuò)誤。馬庫(kù)斯原本認(rèn)為OpenAI不太可能獲得另一輪大規(guī)模融資，更不用說(shuō)估值超1500億美元。但時(shí)間會(huì)證明這是否是一項(xiàng)明智的投資。

在2024年2月Sora公布后不久，馬庫(kù)斯指出其在物理領(lǐng)域的問(wèn)題，并預(yù)測(cè)這些問(wèn)題不會(huì)消失。這一預(yù)測(cè)目前仍然成立。

馬庫(kù)斯在2022年12月關(guān)于GPT-4的七項(xiàng)預(yù)測(cè)（見(jiàn)下圖）大部分已被證實(shí)（第七項(xiàng)仍待驗(yàn)證），適用于2024年發(fā)布的所有模型。