編輯 | 言征
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
2024最后一天,總是要寫一寫總結(jié)的。但大家都清楚,大模型相較于2023年來(lái)看,雖然模型的參數(shù)規(guī)模沒(méi)有卷大太多,但火爆的創(chuàng)新卻相較一年前有了從0到1的跨越。
今年既可以說(shuō)是“大模型穩(wěn)健前行”的一年,也可以說(shuō)是“大模型落地探索”的元年。這兩個(gè)維度少一個(gè)維度去講,都不太完整。
所以索性,小編直接不從這兩個(gè)維度入手,簡(jiǎn)單粗暴地先為大家梳理那些“理想豐滿、現(xiàn)實(shí)骨感”的瞬間,再將一眾科技巨頭和創(chuàng)業(yè)者們的成績(jī)單(和感悟)整理在此,以供諸位閱讀。
“出道即巔峰”,打臉才是常態(tài)
1、英偉達(dá)逆襲成“斗帝”,B200是大招(不過(guò)產(chǎn)量低)
在大模型這片斗氣大陸上,強(qiáng)者為尊。英偉達(dá)作為旱澇無(wú)憂的新晉斗帝,吸金能力足以撼動(dòng)半個(gè)地球,市值一路從2022 年的3640 億美元到2023年的年中的1萬(wàn)億美元,再到如今的3.43萬(wàn)億美元。然而恐怖如斯的GPU霸主,同樣也有打臉的瞬間。
圖片
3月19日深夜,GTC全場(chǎng)高潮迭起,黃仁勛“輕咬著舌頭、左手一個(gè)H100,右手一個(gè)B200”的照片,紛紛成為了業(yè)界媒體新聞的封面熱圖。Blackwell芯片作為黃教主預(yù)告的最強(qiáng)芯片,可謂吊足了全世界的胃口,包括一眾投資人的預(yù)期,外界感嘆:“太強(qiáng)了,抄無(wú)可抄!”
但可惜,臨近年底,英偉達(dá)三季度財(cái)報(bào)公布前,就曝出了英偉達(dá)B200芯片因芯片設(shè)計(jì)缺陷不得不將Blackwell架構(gòu)芯片的生產(chǎn)和交付推遲了至少一個(gè)季度的消息。
小編語(yǔ):打臉肯定是打臉!但不耽誤B200作為最強(qiáng)的GPU算力存在,沒(méi)有一開(kāi)始就完美的產(chǎn)品,英偉達(dá)也不例外!在探索中打臉本就是個(gè)常態(tài)。
2、一款小玩意,賣瘋了,但很快被證偽。。。
新年伊始,1月中旬,一款口袋大小的橙色小設(shè)備,Rabbit R1迅速走紅網(wǎng)絡(luò),這款設(shè)備在正式發(fā)布后的24小時(shí)內(nèi)售出了10,000臺(tái),售罄。
這小東西外觀大小如同“小霸王”掌中機(jī),觸摸屏、旋轉(zhuǎn)式攝像頭、滾動(dòng)輪。然而指令上,優(yōu)先考慮直觀的手勢(shì)和語(yǔ)音命令,而不是鍵盤和菜單。
圖片
該設(shè)備最大的亮點(diǎn)在于內(nèi)置“大型操作模型(Large Action Model,LAM)”,堪稱“萬(wàn)能應(yīng)用控制器”,無(wú)需使用手機(jī),就能集播放音樂(lè)、購(gòu)物、發(fā)信息等多種功能于一身,甚至還能訓(xùn)練它學(xué)習(xí)操作特定應(yīng)用。
不過(guò),Rabbit R1很快就被用戶反饋出不少毛病,雖然沒(méi)有像老對(duì)手“AI Pin”那樣烏泱泱地被退貨,但也給現(xiàn)在做AI硬件的人提了醒:
一、被用戶指責(zé):買來(lái)基本沒(méi)啥用,因?yàn)樗茏鍪虑椋诎沧可贤瑯幽茏觯慰嘟贿@個(gè)智商稅。二、Rabbit R1 作為用戶的個(gè)人助理,必然涉及到用戶的敏感個(gè)人信息,而 Rabbitude 團(tuán)隊(duì)最新研究表明其 API 存在安全漏洞,導(dǎo)致用戶數(shù)據(jù)泄露。
小編語(yǔ):做AI產(chǎn)品,idea也許可以讓你一夜爆紅,但事實(shí)證明:“實(shí)用+安全”才是硬通貨。
國(guó)內(nèi)模型創(chuàng)業(yè)者們:努力留在牌桌上
1、下沉:中國(guó)大模型備案多達(dá)252款,超一半下沉到行業(yè)
大模型世界中,開(kāi)宗立派的強(qiáng)者如林,截止到11月17日,網(wǎng)信辦公開(kāi)的通過(guò)備案的大模型就多達(dá)252款。較去年年底,猛增了190款。
這190款中,其實(shí)行業(yè)大模型數(shù)量多達(dá)145個(gè),占比高達(dá)76%,主要是教育、文化娛樂(lè)兩大核心場(chǎng)景。
而在去年,行業(yè)模型的占比僅為55%。上半年,總有103個(gè)大模型完成備案,其中1月、3月、5月的模型備案數(shù)量均超過(guò)20個(gè);下半年,大模型備案數(shù)量為87個(gè),其中10月更是備案數(shù)量更是創(chuàng)出歷史新高,達(dá)到31家。
圖片
這與全球大模型的發(fā)展趨勢(shì)有很大不同。根據(jù)lifearchitect.ai數(shù)據(jù),今年2月,全球發(fā)布新模型的數(shù)量達(dá)到28個(gè),達(dá)到歷史最高峰。隨后這個(gè)數(shù)字開(kāi)始持續(xù)下滑,10月單月全球新模型的數(shù)量只有12個(gè),這也是2023年上半年的水平。
小編語(yǔ):145家行業(yè)大模型通過(guò)備案,說(shuō)明了國(guó)內(nèi)對(duì)于“讓大模型下沉干實(shí)事”是達(dá)成了事實(shí)上的共識(shí),只是入場(chǎng)者需要注意到模型發(fā)展會(huì)慢慢進(jìn)入飽和期,從全球模型發(fā)布數(shù)量以明顯減少的趨勢(shì)看,一定要注意:2025將會(huì)是一場(chǎng)大考,活下去才是關(guān)鍵。
2、活下去:六小虎定位愈發(fā)清晰,努力留在牌桌上
在大模型創(chuàng)業(yè)領(lǐng)域,各家公司定位和融資情況各異。先來(lái)看國(guó)內(nèi)六小虎的一年:
- 智譜AI以To B定位,今年完成兩輪融資,商業(yè)化收入增長(zhǎng)超過(guò)100%。
- 月之暗面聚焦長(zhǎng)文本領(lǐng)域,今年完成超十億美金融資,估值達(dá)25億美金。值得一提的是,kimi在月活表現(xiàn)上僅次于字節(jié)豆包,10月就達(dá)到了3600萬(wàn)。
- Minimax在C端應(yīng)用上取得成功,今年ARR收入或達(dá)7000萬(wàn)美金,完成6億美元B輪融資。
- 百川智能明確AI應(yīng)用場(chǎng)景,完成A輪融資,估值200億元。
- 零一萬(wàn)物經(jīng)歷高管團(tuán)隊(duì)動(dòng)蕩,但發(fā)布千億參數(shù)模型,完成數(shù)億美元融資。
- 階躍星辰堅(jiān)持AGI目標(biāo),12月完成數(shù)億美元融資。
圖片
其他玩家也有取得不錯(cuò)的成績(jī)。面壁智能作為端側(cè)大模型玩家,完成數(shù)億元融資;生數(shù)科技和愛(ài)詩(shī)科技在AI視頻生成領(lǐng)域表現(xiàn)突出,愛(ài)詩(shī)科技完成近3億元人民幣融資。這些公司在大模型領(lǐng)域各有側(cè)重,融資情況顯示出市場(chǎng)對(duì)其技術(shù)和商業(yè)前景的認(rèn)可。
小編語(yǔ):大模型創(chuàng)業(yè)公司本身的進(jìn)入門檻就很高,即便是已經(jīng)成為獨(dú)角獸估值的創(chuàng)業(yè)公司,也需要持續(xù)的融資才能在愈發(fā)激烈的競(jìng)爭(zhēng)環(huán)境中找到屬于自己的PMF。努力活下去,2025才是一場(chǎng)生死大考。
3、開(kāi)源:資源限制倒逼出國(guó)產(chǎn)之光反超Llama
12月26日晚,中國(guó)OSS界的新星DeepSeek開(kāi)源了其最新研發(fā)的前沿模型V3,根據(jù)公布的性能基準(zhǔn)測(cè)試,DeepSeek-V3在眾多其他開(kāi)閉源模型中脫穎而出,表現(xiàn)優(yōu)于Meta的旗艦產(chǎn)品——擁有4050億個(gè)參數(shù)的Llama 3.1模型。“綜合評(píng)估表明,DeepSeek-V3已成為當(dāng)前可用的最強(qiáng)開(kāi)源模型,其性能可與GPT-4o和Claude-3.5-Sonnet等領(lǐng)先的閉源模型相媲美。”
還有一點(diǎn)被人們津津樂(lè)道:2個(gè)月、2000張H800卡,就搞出了GPT-4o級(jí)別的模型。
圖片
小編語(yǔ):如果說(shuō)閉源是天花板,那么讓GPT4o人人都能掌握、用得上的還得是開(kāi)源。另外,開(kāi)源也許不會(huì)是最頂尖的存在,但是會(huì)讓大模型領(lǐng)域“書(shū)同文,車同軌,量同衡,行同倫”的必然之選。學(xué)術(shù)界、工程界需要這樣的開(kāi)源技術(shù)才能有共同交流進(jìn)步的基礎(chǔ);此外,資源雖然可以限制想象,但同樣也可以倒逼我們重塑自身。
國(guó)內(nèi)大廠的大模型成績(jī)單
國(guó)內(nèi)幾家大廠在AI大模型和產(chǎn)品領(lǐng)域各有側(cè)重,百度和阿里在模型側(cè)和應(yīng)用場(chǎng)景上表現(xiàn)突出,騰訊在多模態(tài)能力上有所建樹(shù),而字節(jié)跳動(dòng)則在應(yīng)用端和智能硬件上展現(xiàn)出強(qiáng)勁的增長(zhǎng)勢(shì)頭。
在大模型和產(chǎn)品領(lǐng)域,可以看到幾家各自都有自己的年度kpi:
1、百度文心一言:日均模型調(diào)用量15億,用戶規(guī)模4.3億
百度作為早期入局AI大模型的互聯(lián)網(wǎng)大廠,其文心大模型矩陣包括ERNIE 4.0 Turbo等旗艦大模型和輕量模型,日均調(diào)用量超15億,用戶規(guī)模達(dá)到4.3億。
產(chǎn)品側(cè),文心一言App升級(jí)為“文小言”,定位“新搜索”智能助手,月活躍用戶達(dá)到千萬(wàn)級(jí)別,累計(jì)調(diào)用量超過(guò)20億次。
百度強(qiáng)調(diào)知識(shí)增強(qiáng)、檢索增強(qiáng)及智能體技術(shù),發(fā)布檢索增強(qiáng)的文生圖技術(shù)iRAG和多智能體應(yīng)用秒噠和文心快碼。
2、阿里通義千問(wèn):將開(kāi)源進(jìn)行到底,夸克稱AI搜索一霸
阿里云發(fā)布通義千問(wèn)新一代開(kāi)源模型Qwen2.5,性能超越Llama 405B,覆蓋全場(chǎng)景,累計(jì)上架超100個(gè)模型,下載量突破4000萬(wàn)。
夸克作為“AI全能助手”,重點(diǎn)升級(jí)AI搜索、AI寫作等功能,存量用戶與AI應(yīng)用用戶畫像高度吻合,是阿里AI戰(zhàn)略的重要看點(diǎn)。
3、騰訊混元:發(fā)力多模態(tài),類Sora視頻模型開(kāi)源
騰訊混元在基座模型和產(chǎn)品應(yīng)用上相對(duì)掉隊(duì),但多模態(tài)能力是亮點(diǎn),特別是在視頻生成領(lǐng)域。
騰訊混元大模型宣布正式上線視頻生成能力,并開(kāi)源130億參數(shù)量視頻生成大模型,是當(dāng)前最大的視頻開(kāi)源模型。
4、字節(jié)豆包:日活750萬(wàn),斷層領(lǐng)先,產(chǎn)品全系覆蓋
字節(jié)跳動(dòng)豆包系列已包含多種模型,覆蓋文本、語(yǔ)音、圖片及視頻等多模態(tài)能力,近期加強(qiáng)視頻識(shí)別與理解能力。
豆包大模型日均tokens使用量超過(guò)4萬(wàn)億,豆包App日活達(dá)760萬(wàn),成為日活斷層領(lǐng)先的AI應(yīng)用。
字節(jié)跳動(dòng)打造了自己的AI應(yīng)用艦隊(duì),覆蓋AIGC、Agent等主流方向,并在AI耳機(jī)、AI眼鏡等智能硬件上蓄勢(shì)待發(fā)。
小編語(yǔ):國(guó)內(nèi)互聯(lián)網(wǎng)大廠肯定希望用大模型的人多起來(lái),但肯定也希望從中獲得相應(yīng)的業(yè)務(wù)增長(zhǎng)。有人說(shuō)百度再一次起大早趕晚集,字節(jié)算是最舍得投入的公司,但這往往取決于各大廠對(duì)于在大模型的“斗氣大陸”中選擇的哪一系的修煉方向。百度偏向深入企業(yè)端,字節(jié)要在C端擊穿用戶場(chǎng)景。騰訊目前看,應(yīng)該還在打磨killer App,阿里同樣也在重新布局中尋找AI時(shí)代的最強(qiáng)場(chǎng)景。
值得關(guān)注的幾個(gè)方向
1、FSD全自動(dòng)駕駛:馬斯克跑通大模型Robotaxi
10月11日,馬斯克在“載入人類史冊(cè)”的發(fā)布會(huì)現(xiàn)場(chǎng)搭乘著完全無(wú)人駕駛的Robotaxi進(jìn)入發(fā)布會(huì)現(xiàn)場(chǎng),現(xiàn)場(chǎng)一陣歡呼!這一幕值得銘記。
這輛Cybercab極簡(jiǎn)的設(shè)計(jì),強(qiáng)調(diào)了未來(lái)感。這是一輛沒(méi)有方向盤、踏板和側(cè)后視鏡的車輛。當(dāng)然這并不是重點(diǎn),重點(diǎn)是這輛車的成本極低,馬斯克表示,一定能把價(jià)格打下來(lái):Cybercab的自動(dòng)駕駛成本,會(huì)隨著大規(guī)模的投產(chǎn)而持續(xù)降低,目標(biāo)是從目前的每英里1美元,降低至0.2美元。
據(jù)悉,Cybercab將完全依賴特斯拉的全自動(dòng)駕駛(FSD)軟件、不排除是攝像頭甚至是激光雷達(dá)的可能、交互則可能主要依賴Robotaxi APP。
也就是說(shuō),技術(shù)路線已經(jīng)被馬斯克驗(yàn)證跑通。馬斯克所說(shuō)的用無(wú)人駕駛來(lái)提高車的使用時(shí)長(zhǎng)這一點(diǎn)也就行得通了。
小編語(yǔ):這也就不難理解,雷軍和理想現(xiàn)在都不約而同的要實(shí)現(xiàn)“人車家”或者“硅基家人”,本質(zhì)上都是要通過(guò)入局大模型,實(shí)現(xiàn)L4級(jí)的無(wú)人駕駛!
2、機(jī)器人or狗?
機(jī)器人賽道,同樣是一個(gè)天然和大模型相匹配的賽道。而且業(yè)內(nèi)已經(jīng)驗(yàn)證了可行性,高端的有特斯拉在10月“We Robot”活動(dòng)上亮相的擎天柱,推出了第三代機(jī)械手,有22個(gè)自由度,堪稱霸榜。波士頓作為老玩家,e-Altas可以解鎖很多瘋狂的體操動(dòng)作,實(shí)現(xiàn)360度的關(guān)節(jié)運(yùn)轉(zhuǎn)。量產(chǎn)方面,傅氏智能的GR-1是少有的實(shí)現(xiàn)1000臺(tái)規(guī)模的大規(guī)模量產(chǎn)型號(hào)。此外,還有放生肌肉和肌腱設(shè)計(jì)的機(jī)器人開(kāi)始涌現(xiàn)。
除了高端的賽道,廉價(jià)的家用機(jī)器人或機(jī)器狗,也開(kāi)始得到業(yè)界的關(guān)注。這一類機(jī)器人比汽車便宜,可擴(kuò)展性強(qiáng),不難想象未來(lái)中產(chǎn)階層都可以人手一臺(tái)拉拉風(fēng)。最近就有宇樹(shù)科技B2-W四輪機(jī)器狗,翻山越嶺過(guò)江,搭載主人如履平地,機(jī)動(dòng)性遠(yuǎn)超現(xiàn)實(shí)世界的牛馬。另外還有適合家居的斯坦福機(jī)器人ALOHA,兩個(gè)夾爪可完成煎蛋、折疊衣物等復(fù)雜動(dòng)作,價(jià)位也非常便宜。
圖片
小編語(yǔ):人形機(jī)器人和機(jī)器狗看似兩個(gè)方向,但最后都是為了節(jié)省人的時(shí)間,小編不相信大家會(huì)買來(lái)一臺(tái)把它當(dāng)拉風(fēng)的工具或者寵物來(lái)炫耀。如果要進(jìn)軍這兩條賽道,入門的話可以看看開(kāi)源的機(jī)器人設(shè)計(jì)方案,但切記:據(jù)小編線下了解,這個(gè)賽道水同樣很深,大模型、算法反而不是什么壁壘,壁壘更多在于算法之外的東西。
3、視頻生成和世界建模
之所以最后提視頻生成和世界建模,是因?yàn)樾【幭胍]環(huán)到最開(kāi)始那個(gè)“出道即巔峰”的段落。
2024新春伊始,Sora橫空引爆整個(gè)業(yè)界對(duì)于AGI的想象,然而最終一直拖到12月才發(fā)布。作為同類產(chǎn)品中第一個(gè)高分辨率長(zhǎng)視頻的生成產(chǎn)品,起大早趕晚集總是會(huì)讓人們產(chǎn)生祛魅之意。不過(guò),是Sora給業(yè)界帶來(lái)了“文本調(diào)節(jié)的視覺(jué)世界模擬”的可能,更關(guān)鍵的是,這個(gè)模型還可以通過(guò)一些去燥和提督學(xué)習(xí)來(lái)學(xué)習(xí)更復(fù)雜的渲染和直觀的物理模擬。
此外,谷歌在這方面反而是推出了更精確的物理和細(xì)粒度的物體動(dòng)力學(xué)的產(chǎn)品發(fā)布Veo。
值得關(guān)注的一個(gè)方向是,行動(dòng)驅(qū)動(dòng)的世界模型,比如GameGen、Genie-2等可以在擴(kuò)散模型內(nèi)使用操縱桿控制運(yùn)行更多的游戲。
再有,就是華人大佬李飛飛領(lǐng)導(dǎo)創(chuàng)建的Worldlabs,非常有看頭:它具有很強(qiáng)的幾何一致性,一張圖可以生成一整個(gè)3D世界,應(yīng)用前景十分廣闊。
寫在最后
2024,發(fā)生了太多值得回憶總結(jié)的內(nèi)容,還有很多沒(méi)有提及,比如OpenAI帶頭讓強(qiáng)化學(xué)習(xí)回歸到AGI的Scaling Law中來(lái),再比如谷歌的量子芯片。大模型時(shí)代剛剛2年,就已經(jīng)從底層到應(yīng)用層涌現(xiàn)出了這么多令人難以置信的創(chuàng)新。
但小編想說(shuō)的是,強(qiáng)如英偉達(dá)、OpenAI、蘋果同樣也會(huì)有在創(chuàng)新中打臉折戟的時(shí)刻,這是一個(gè)新時(shí)代從萌芽到繁榮的必經(jīng)之路。這一過(guò)程也許不會(huì)像《黑神話悟空》那樣打妖王升裝備那么酣暢淋漓,但肯定的一點(diǎn)是:現(xiàn)實(shí)比游戲更為精彩,創(chuàng)業(yè)者努力前行,好產(chǎn)品終會(huì)到來(lái)!
共勉,敬每一位2025的堅(jiān)持者!新年快樂(lè)!