AI盈利難、機(jī)器人泡沫多!馬庫(kù)斯25年AI預(yù)測(cè),隔空喊話?cǎi)R斯克
去年,馬庫(kù)斯對(duì)于AI趨勢(shì)的預(yù)測(cè)幾乎全部正確,但完全沒(méi)想到OpenAI可以估值到1500億美元。
在本月2日,馬庫(kù)斯發(fā)表了對(duì)2025年的25個(gè)AI預(yù)測(cè),涵蓋AGI、GenAI、自動(dòng)駕駛、人形機(jī)器人、智能體等多個(gè)方向。
馬斯克(Elon Musk),曾預(yù)測(cè)2025年底的AI能力:「我們就會(huì)擁有比任何人都聰明的AI」。
馬庫(kù)斯對(duì)此并不認(rèn)同,主要預(yù)測(cè)內(nèi)容如下:
1. 反對(duì)馬斯克的預(yù)言,到2025年底不會(huì)出現(xiàn)強(qiáng)人工智能。
2. GenAI的可靠性、推理、幻覺(jué)、能耗等問(wèn)題得不到根本的解決。
3. 智能體和類人機(jī)器人在2025年會(huì)得到大量宣傳,但應(yīng)用有限。
4. AI模型盈利難,估值開始下滑;OpenAI市場(chǎng)表現(xiàn)不佳;自動(dòng)駕駛難落地。
對(duì)2025年的25項(xiàng)預(yù)測(cè)
高置信度預(yù)測(cè)
1 通用人工智能(AGI)不會(huì)在2025年實(shí)現(xiàn)。(可能會(huì)有人通過(guò)弱化定義甚至用經(jīng)濟(jì)標(biāo)準(zhǔn)重新定義AGI來(lái)試圖混淆概念。)
2 到2025年底,沒(méi)有任何單一系統(tǒng)能可靠解決四項(xiàng)以上的Marcus-Brundage的AI 2027任務(wù),甚至可能沒(méi)有任何任務(wù)被完全解決。
3 AI模型的盈利將繼續(xù)保持在中等偏下水平甚至可能不復(fù)存在(芯片制造公司如NVIDIA在供應(yīng)硬件方面會(huì)繼續(xù)表現(xiàn)優(yōu)異,但模型開發(fā)公司在這場(chǎng)「淘金熱」中只能充當(dāng)「賣鏟子」的角色)。
4 美國(guó)幾乎不會(huì)有實(shí)質(zhì)性法規(guī)出臺(tái),消費(fèi)者仍面臨GenAI帶來(lái)的風(fēng)險(xiǎn)。全球其他地區(qū)在法規(guī)制定上會(huì)越來(lái)越參考?xì)W洲的做法。
5 國(guó)家AI安全研究所將提供指導(dǎo),但它們對(duì)危險(xiǎn)模型的約束力將非常有限。
6 GenAI的可靠性問(wèn)題將在2025年持續(xù)存在。
7「幻覺(jué)」現(xiàn)象(即生成內(nèi)容中的虛構(gòu)敘述)問(wèn)題將繼續(xù)困擾GenAI。
8 推理能力的不足仍將繼續(xù)困擾GenAI。
9 AI「智能體」將在2025年被廣泛宣傳,但在除了一些非常狹窄的應(yīng)用場(chǎng)景外,仍然難以實(shí)現(xiàn)可靠性。
10 類人機(jī)器人將受到大量宣傳,但不會(huì)有產(chǎn)品能夠接近The Jetsons中「Rosie機(jī)器人」的能力。盡管運(yùn)動(dòng)控制可能表現(xiàn)優(yōu)異,但場(chǎng)景意識(shí)和認(rèn)知靈活性仍然不足。
The Jetsons中的機(jī)器人Rosie
11 OpenAI將繼續(xù)提前數(shù)月甚至數(shù)年預(yù)覽產(chǎn)品,但正式推出和廣泛可用仍需較長(zhǎng)時(shí)間。(例如,Sora于2024年2月預(yù)覽,直到12月才正式發(fā)布,且受到使用限制;Sal Khan在2024年5月演示的AI家庭教師仍未普及;o3 已進(jìn)行了預(yù)覽,但尚未發(fā)布,其價(jià)格可能相當(dāng)昂貴。)
12 與2016年Hinton的預(yù)測(cè)相反,很少有放射科醫(yī)生會(huì)被AI替代。
13 真正的無(wú)人駕駛汽車(無(wú)需人類參與交通)仍將限制在少數(shù)城市,且在天氣良好的條件下。人類駕駛員仍將在經(jīng)濟(jì)中占很大比重。
14 GenAI的版權(quán)相關(guān)訴訟將在2025年持續(xù)不斷。
15 AI模型的能耗將上升并會(huì)成為一個(gè)主要問(wèn)題,但很少有GenAI公司會(huì)公開用電量。
16 被AI替代的勞動(dòng)力比例將少于10%,可能少于5%。商業(yè)藝術(shù)家和配音演員可能受到最大的影響。(當(dāng)然,隨著人們開始使用新工具,許多工作也會(huì)隨之改變。)
17 馬庫(kù)斯依然堅(jiān)持關(guān)于o3的預(yù)測(cè),即一開始人們會(huì)感到驚奇,然而一旦深入探究就會(huì)發(fā)現(xiàn)o3不可靠;o3在封閉領(lǐng)域(比如數(shù)學(xué))表現(xiàn)最佳,而在開放領(lǐng)域(比如關(guān)于真實(shí)世界的日常推理)表現(xiàn)欠佳。
中等置信度預(yù)測(cè)
18 技術(shù)「護(hù)城河」仍然難以建立。相反,中美兩國(guó)將趨同到大體相似的AI模型;歐洲的部分系統(tǒng)也將趕上大致相同的位置。
19 由于價(jià)格及其穩(wěn)定性與價(jià)格不匹配的原因,很少有公司(更不要提更少的消費(fèi)者)會(huì)大規(guī)模采用o3。
20 公司將繼續(xù)嘗試使用AI,但將其全面采用為生產(chǎn)級(jí)系統(tǒng)并在現(xiàn)實(shí)世界中大規(guī)模部署的態(tài)度仍然會(huì)非常謹(jǐn)慎。
21 2025年可能成為AI大公司估值開始下滑的一年。(盡管正如那句名言所說(shuō),「市場(chǎng)的非理性比你的償付能力持續(xù)得更久。」)
22 Sora在物理學(xué)領(lǐng)域?qū)⒗^續(xù)表現(xiàn)不佳。(谷歌的Veo 2看起來(lái)似乎有所改進(jìn),但由于尚未親自測(cè)試,仍然懷疑其在狀態(tài)變化和對(duì)象持久性上的問(wèn)題。另一種尚未完全發(fā)布的基于不同原理的混合系統(tǒng),稱為Genesis,看起來(lái)可能很有前景。)
23 神經(jīng)符號(hào)AI的影響力將在2025年顯著增加。
低置信度預(yù)測(cè),但值得討論
24 我們很可能會(huì)看到GenAI在大規(guī)模網(wǎng)絡(luò)攻擊中扮演重要的重要角色。馬庫(kù)斯將在Politico中發(fā)表一篇短文,討論可能的4種方式。
25 到2025年底,可能仍然不會(huì)出現(xiàn)「GPT-5級(jí)別」的模型(即通過(guò)社區(qū)共識(shí)認(rèn)為在各方面實(shí)現(xiàn)重大飛躍的模型)。相反,我們可能會(huì)看到像o1這樣的模型,它在許多可生成高質(zhì)量合成數(shù)據(jù)的任務(wù)中表現(xiàn)良好,但在其他領(lǐng)域僅比GPT-4有小幅改進(jìn)。
2024年的預(yù)測(cè)回顧
總的來(lái)說(shuō),馬庫(kù)斯對(duì)2024年預(yù)測(cè)盡管存在一些需要注意的地方,但大體上得到了驗(yàn)證。
核心預(yù)測(cè)
在2024年3月, 馬庫(kù)斯發(fā)帖總結(jié)了對(duì)2024年的最核心的預(yù)測(cè)。
唯一的例外可能是OpenAI的o3,它在去年12月宣布,但至今未發(fā)布,也未接受廣泛的審查。
除此之外,所有七條預(yù)測(cè)基本上都非常接近預(yù)期。
2024年的現(xiàn)實(shí)情況:
- 我們目前仍然處于GPT-4級(jí)別階段,這些模型只是做了些許漸進(jìn)性的改動(dòng),沒(méi)有一個(gè)值得OpenAI冠以GPT-5之名。
- 如今有許多類似的模型,市場(chǎng)上充斥著價(jià)格戰(zhàn),幾乎沒(méi)有護(hù)城河。
- 幻覺(jué)問(wèn)題依然沒(méi)有得到有效解決。
- 企業(yè)級(jí)的采用遠(yuǎn)不如大多數(shù)人原本預(yù)期的那樣廣泛,所有公司的總體利潤(rùn)(當(dāng)然,硬件公司如英偉達(dá)除外,它們通過(guò)銷售芯片而非AI模型獲利)也充其量只是中等偏下水平的增長(zhǎng)。
- 到目前為止,參與的許多公司都在虧損,雖然至少有三家公司被半收購(gòu),而它們?yōu)橥顿Y者帶來(lái)的利潤(rùn)極為有限。
- 2024年最重大的AI事件并不是大家期待已久的GPT-5發(fā)布,盡管粉絲們整年都在預(yù)測(cè)它的到來(lái),但它始終未曾出現(xiàn)。
2024年的其他預(yù)測(cè)
馬庫(kù)斯從2022年開始,就預(yù)言單純依靠擴(kuò)展大語(yǔ)言模型 (LLM) 的方法最終會(huì)走到盡頭,在2024年11月和12月業(yè)內(nèi)人士的評(píng)論似乎驗(yàn)證了這一預(yù)測(cè)。
馬庫(kù)斯在2022年提出的「scaling law」并非物理定律,而是具有有限生命周期的泛化規(guī)則的觀點(diǎn),在最近幾個(gè)月得到了廣泛傳播。
馬庫(kù)斯提出的「AI碰壁」(hitting a wall)這一概念在CNN、《The Verge》和《華爾街日?qǐng)?bào)》等媒體中也得到廣泛報(bào)道。
馬庫(kù)斯關(guān)于「擴(kuò)展scaling與收益遞減」的觀點(diǎn)和相關(guān)術(shù)語(yǔ)已逐漸普及。
馬庫(kù)斯在2022年,以及早在2001年出版的《The algebraic mind》一書中提出的具體弱點(diǎn)(如組合性、事實(shí)性和推理能力等)依然存在。盡管這些問(wèn)題或許會(huì)在未來(lái)得到解決,但當(dāng)前的技術(shù)手段顯然不夠。
馬庫(kù)斯在1998年、1999年和2001年,以及之后多次強(qiáng)調(diào)的分布漂移(distribution shift)問(wèn)題,在最近的研究中得到了多次印證,例如蘋果公司的關(guān)于推理的著名論文。
論文鏈接:https://arxiv.org/pdf/2410.05229
在2022年12月,馬庫(kù)斯預(yù)測(cè)的聊天機(jī)器人導(dǎo)致死亡的事件。
在2023年,該預(yù)言不幸得到了證實(shí),而2024年似乎又出現(xiàn)了類似案例。
關(guān)于AI生成錯(cuò)誤信息,馬庫(kù)斯的警告正在逐步成為現(xiàn)實(shí),盡管到目前為止,其影響比最初擔(dān)憂的要輕。但馬庫(kù)斯仍然感到擔(dān)憂,并認(rèn)為需要保持警惕。
在2023年2月,馬庫(kù)斯提出的關(guān)于GenAI破壞互聯(lián)網(wǎng)的警告,越來(lái)越顯得正確。
馬庫(kù)斯在2022年11月預(yù)測(cè),LLM不會(huì)立即顯著改善如亞馬遜Alexa等商業(yè)AI智能體,這一預(yù)測(cè)在2024年仍然成立。
馬庫(kù)斯預(yù)測(cè)2024年會(huì)被視為「AI 幻滅之年」。這一說(shuō)法可能有些夸大,但對(duì)部分人來(lái)說(shuō)卻是事實(shí)。雖然許多人仍然對(duì)AI熱情不減,但也有不少人大失所望。例如,《華爾街日?qǐng)?bào)》報(bào)道:「微軟AI機(jī)器人的早期采用者懷疑其是否物有所值」。
馬庫(kù)斯在2023年關(guān)于OpenAI可能被視為AI界WeWork的預(yù)測(cè)尚未得到驗(yàn)證,但OpenAI的處境仍不樂(lè)觀。
OpenAI尚未盈利,預(yù)計(jì)至少到2029年之前都不會(huì)盈利,其消耗資金的速度以十億美元計(jì),且仍缺乏明確的技術(shù)護(hù)城河。從長(zhǎng)期來(lái)看,特別是在高估值情況下,安全性仍然不確定。記者Ed Zitron和經(jīng)濟(jì)學(xué)家Brad DeLong等人也越來(lái)越多地表達(dá)了類似觀點(diǎn)。
關(guān)于生成式A技術(shù)和經(jīng)濟(jì)限制的預(yù)測(cè)大體正確,但馬庫(kù)斯對(duì)投資者的判斷完全錯(cuò)誤。馬庫(kù)斯原本認(rèn)為OpenAI不太可能獲得另一輪大規(guī)模融資,更不用說(shuō)估值超1500億美元。但時(shí)間會(huì)證明這是否是一項(xiàng)明智的投資。
在2024年2月Sora公布后不久,馬庫(kù)斯指出其在物理領(lǐng)域的問(wèn)題,并預(yù)測(cè)這些問(wèn)題不會(huì)消失。這一預(yù)測(cè)目前仍然成立。
馬庫(kù)斯在2022年12月關(guān)于GPT-4的七項(xiàng)預(yù)測(cè)(見(jiàn)下圖)大部分已被證實(shí)(第七項(xiàng)仍待驗(yàn)證),適用于2024年發(fā)布的所有模型。