Llama 論文作者“出逃”,14人團(tuán)隊(duì)僅剩3人,法國獨(dú)角獸 Mistral 成最大贏家
他們大多去向了 Mistral,這家總部位于巴黎的 AI 初創(chuàng)公司,正在用“開源速度”反攻 Meta 自己開啟的戰(zhàn)場。
Llama 曾是 Meta 最具野心的 AI 作品:在 ChatGPT 和 PaLM 占據(jù)主流話語權(quán)的 2023 年,Meta 用一篇重量級論文和一組開放權(quán)重的大語言模型,意外地把開源陣營推上主舞臺。而那時(shí),Meta 的 AI 科研團(tuán)隊(duì) FAIR(Fundamental AI Research)也正處于高光時(shí)刻。
圖片
那篇震驚行業(yè)的論文:https://arxiv.org/pdf/2302.13971
但兩年后,這條路線似乎走到了一個(gè)岔口。
Meta 官方尚未對“人才流失”作出正面回應(yīng),社交平臺 X 上已經(jīng)有一些討論。目前,14 位在 Llama 論文中署名的研究者,目前只剩 3 位仍在 Meta。有人形評論:Meta 打開了一條通往開源未來的路,卻眼睜睜看著建路的人轉(zhuǎn)身離開,另起爐灶。
圖片
1.一條持續(xù)的人才遷徙線
從 LinkedIn 記錄看,Llama 團(tuán)隊(duì)的出走并非一朝一夕,它悄然展開于 2023 年初,至 2025 年初幾近完成。
最早一批離開的,是 Meta 內(nèi)部資深研究員 Guillaume Lample 和 Timothée Lacroix。他們幾乎是 Llama 架構(gòu)的奠基者,離職時(shí)間分別是 2023 年年初和 6 月。隨后,他們在巴黎創(chuàng)立了 Mistral AI。
圖片
圖注:Timothée Lacroix、Arthur Mensch和Guillaume Lample 是Mistral AI公司的聯(lián)合創(chuàng)始人。其中Lacroix與 Lample 曾參與撰寫Meta公司原始Llama論文。圖片來源于businessinsider,由Khanh Renaud/ABACAPRESS.COM提供。侵刪
接下來的一年半內(nèi),包括 Marie-Anne Lachaux、Thibaut Lavril、Baptiste Rozière 等多位 Llama 作者陸續(xù)加入這家初創(chuàng)公司。如今,Mistral 的研究骨干中,有一整支前 Meta 團(tuán)隊(duì)。
而其他人也未偏離 AI 一線戰(zhàn)場。有人去了 Anthropic、DeepMind、微軟 AI,也有人加入了 Kyutai、Cohere 等二線研究機(jī)構(gòu)。
他們平均在 Meta 任職超過五年,絕非“打工人式的流動”。這更像一次認(rèn)知的重構(gòu)——那些曾深度參與 Meta AI 體系設(shè)計(jì)的人,正在以離職的方式,表達(dá)自己的方向選擇。
2.Meta 的開源理想,走得比公司戰(zhàn)略更快
Meta 推出 Llama 時(shí),用了一個(gè)不小的策略跳躍:它不再將模型封閉運(yùn)行,而是開放權(quán)重、共享參數(shù),允許開發(fā)者在單張 GPU 上復(fù)現(xiàn)最前沿模型。這在彼時(shí)是對 OpenAI 和 Google 的商業(yè)閉環(huán)思路的一次反向挑戰(zhàn)。
從技術(shù)上說,Llama 的設(shè)計(jì)確實(shí)更輕、更高效。它在資源消耗上做了權(quán)衡,不依賴大量私有數(shù)據(jù),跑得也更快。這些“實(shí)用主義”的工程美學(xué),正契合了開源社區(qū)的理想主義愿景。
但問題是:當(dāng)理想走得太快,公司戰(zhàn)略未必跟得上。
Llama 模型在開發(fā)者間收獲大量好評,Llama 2 更是成為 HuggingFace 上最受歡迎的模型之一。但從 Llama 3 到 Llama 4,業(yè)界的情緒開始轉(zhuǎn)變?!安粔蛐隆薄斑M(jìn)展慢”成為越來越多人的反饋。尤其在 DeepSeek、Qwen 等新勢力爆發(fā)式迭代之后,Meta 逐漸掉隊(duì)。
而更嚴(yán)重的警訊是,Meta 遲遲沒有推出類似 GPT-4 Turbo、Gemini Pro 這樣具備“推理能力”的模型版本。這意味著,在多步推理、鏈?zhǔn)秸{(diào)用、外部工具整合等下一代語言模型方向上,它已經(jīng)落于人后。
圖片
《華爾街日報(bào)》甚至報(bào)道說,Meta 正在推遲其內(nèi)部最大規(guī)模模型 Behemoth 的發(fā)布,因團(tuán)隊(duì)對其性能與領(lǐng)導(dǎo)方向存在分歧。
一邊是慢下來的產(chǎn)品節(jié)奏,一邊是熟悉 Meta 技術(shù)路線的核心研究員大量出走,Meta 顯得前后受敵。
3.FAIR 的隱退與“新 FAIR”的建立
過去一年,Meta 內(nèi)部還有一個(gè)關(guān)鍵變化:領(lǐng)導(dǎo) FAIR 八年的 Joelle Pineau 宣布辭去職務(wù),其位置由 Robert Fergus 接替。這位新領(lǐng)導(dǎo)者曾在 DeepMind 任職五年,也是 FAIR 的早期聯(lián)合創(chuàng)始人。
FAIR 曾是 Meta 研究自信的核心:2014 年創(chuàng)立,曾在圖神經(jīng)網(wǎng)絡(luò)、機(jī)器翻譯、多模態(tài)學(xué)習(xí)等多個(gè)前沿領(lǐng)域發(fā)表影響深遠(yuǎn)的成果。Llama 正是 FAIR 的巔峰之作。
但如今,這支隊(duì)伍核心團(tuán)隊(duì)已散,方向也在變。
過去,F(xiàn)AIR 的基調(diào)是“開放 + 共享”;如今,Meta 對“應(yīng)用”和“效率”的關(guān)注似乎壓倒了科研的探索熱情。在這樣一組矛盾中,很多研究員選擇離開,也就并不難理解。
如果只看人事層面,Meta 的這波人才外流可以被視作“正常的團(tuán)隊(duì)更替”,但事實(shí)顯然不止如此。
Mistral 并不只是吸收前 Meta 員工的公司,它已經(jīng)是 Meta 的直接競爭對手。在多項(xiàng)模型評測中,Mistral 的 Mixtral 和 Tiny Mistral 憑借參數(shù)規(guī)模與效果平衡,擊中了市場的“可部署模型”需求。而這些成果,大多由前 Meta 團(tuán)隊(duì)主導(dǎo)。
這使 Meta 處于一個(gè)尷尬位置:它定義了開源大型模型的第一章,但第二章正在被別人書寫。
4 Mistral:一支從 Meta 出走的隊(duì)伍
圖注:Mistral AI 官網(wǎng)截圖
Mistral AI爆發(fā)式增長始于 2023 年,創(chuàng)立僅一個(gè)月便完成超 1 億美元的種子輪融資,并在之后的一年內(nèi)迅速拉起多個(gè)大模型家族。
Pixtral 面向多模態(tài),Medium 3 瞄準(zhǔn) STEM 和編程任務(wù),“Les Ministraux”則優(yōu)化邊緣部署。
新近上線的 OCR API 和阿拉伯語模型 Saba,表明其產(chǎn)品策略已不再局限于英語語境或科研模型,而是在更廣泛場景中主動擴(kuò)張。
但這場擴(kuò)張背后,挑戰(zhàn)也顯而易見。
圖注:techcrunch 關(guān)于Mistral 60億估值的報(bào)道
首先是“影響力與變現(xiàn)能力不對稱”的困境。雖然聊天助手 Le Chat 在法國一度超越 ChatGPT 登頂 App Store 下載榜,但根據(jù)多方消息,Mistral 的營收仍停留在千萬美元級別。這對于一家估值 60 億美元的公司而言,仍遠(yuǎn)不足以支撐 IPO 或擺脫被收購的猜疑。
模型“開放性”立場的自我張力也受限。Mistral 在早期以 Apache 2.0 協(xié)議開源模型著稱,但進(jìn)入商業(yè)化階段后,其主力模型的權(quán)重并未公開,只保留部分“研究版本”可自由使用。這種“兩軌制”的策略雖可兼顧營收與聲譽(yù),卻也招致部分開源社區(qū)的質(zhì)疑:它是否正在變得越來越“閉源化”?
第三個(gè)隱憂則是國際擴(kuò)展能力。雖然 Mistral 與法國軍方、AFP、Stellantis、IBM、Helsing 等達(dá)成戰(zhàn)略合作,并與 NVIDIA、Bpifrance 在巴黎籌建 AI 校區(qū),但其用戶群體和生態(tài)建設(shè)仍以歐洲市場為主。相比之下,OpenAI 和 Google 已在全球構(gòu)建起完整的 API 平臺、開發(fā)者工具鏈及消費(fèi)級產(chǎn)品矩陣,具備更強(qiáng)的粘性和護(hù)城河。
總結(jié)下來,Mistral 的團(tuán)隊(duì)規(guī)模、融資額和模型能力已經(jīng)達(dá)到一級梯隊(duì)水準(zhǔn),但在全球化運(yùn)營、基礎(chǔ)設(shè)施建設(shè)、以及長期生態(tài)搭建上,它還需要更多時(shí)間證明自己。