開(kāi)源AI的承諾兌現(xiàn)

作者：岱軍 2025-02-07 12:09:37

AI領(lǐng)域主要由少數(shù)幾家資金雄厚的大公司及其AI模型和工具主導(dǎo)，例如OpenAI的GPT系列模型、微軟的Copilot和谷歌的Gemini。

初創(chuàng)公司Oumi已走出隱身模式，獲得1000萬(wàn)美元融資，并推出其高管稱之為真正開(kāi)源的AI平臺(tái)。

譯自Making Good on the Promise of Open Source AI，作者 Jeffrey Burt。

兩年多前，OpenAI發(fā)布其ChatGPT聊天機(jī)器人，開(kāi)啟了生成式AI](https://thenewstack.io/generative-ai-in-2023-genai-tools-became-table-stakes/)時(shí)代，此后發(fā)展迅速，AI行業(yè)似乎一直在試圖定義“開(kāi)放”和“開(kāi)源”在這一時(shí)代中的含義。

AI領(lǐng)域主要由少數(shù)幾家資金雄厚的大公司及其AI模型和工具主導(dǎo)，例如OpenAI的GPT系列模型、微軟的Copilot和谷歌的Gemini。其他公司，其中Meta憑借其Llama模型最為引人注目，都吹噓自己是開(kāi)放的，盡管一些批評(píng)者質(zhì)疑它們到底有多開(kāi)放。

然而，除了關(guān)于定義的爭(zhēng)論之外，缺乏真正廣泛使用的開(kāi)源AI平臺(tái)正在阻礙行業(yè)創(chuàng)新，并造成令人不安的人才缺口假象，曾在谷歌、微軟和Meta等巨頭公司從事AI技術(shù)工作的Manos Koukoumidis表示。

“通常情況下，人們發(fā)布開(kāi)放權(quán)重模型，只是模型本身和權(quán)重，”Koukoumidis告訴The New Stack。“[人們]不知道它是如何開(kāi)發(fā)的，使用了什么代碼，使用了什么數(shù)據(jù)，他們稱之為開(kāi)源，但這并不是一個(gè)非常準(zhǔn)確的描述。現(xiàn)實(shí)情況是，即使是目前的努力，即使是少數(shù)開(kāi)源的——因?yàn)镸eta的‘開(kāi)放權(quán)重’——即使是少數(shù)開(kāi)源的，人們也很難進(jìn)行實(shí)驗(yàn)，繼續(xù)創(chuàng)新并在此工作上相互合作。這是阻礙開(kāi)源世界進(jìn)步的事情。”

正是這一點(diǎn)促使Koukoumidis和Oussama Elachqar——他在微軟、蘋(píng)果和推特（現(xiàn)為X）擁有機(jī)器學(xué)習(xí)經(jīng)驗(yàn)——啟動(dòng)了Oumi，這是一家今天剛剛走出隱身模式的初創(chuàng)公司，它提供兩者都稱之為真正開(kāi)源平臺(tái)的東西。它還獲得了由風(fēng)險(xiǎn)投資公司Venrock和Obvious Ventures領(lǐng)投的1000萬(wàn)美元種子資金。

AI的Linux

Koukoumidis，同時(shí)也是Oumi的首席執(zhí)行官，表示該平臺(tái)——與來(lái)自11家機(jī)構(gòu)的研究人員合作開(kāi)發(fā)，包括麻省理工學(xué)院（MIT）、加州大學(xué)伯克利分校和卡內(nèi)基梅隆大學(xué)——基本上充當(dāng)AI模型和工具的Linux，使研究人員、開(kāi)發(fā)人員和AI專家能夠廣泛合作和貢獻(xiàn)，他們將能夠在彼此的工作基礎(chǔ)上進(jìn)行構(gòu)建。

這不僅會(huì)加速創(chuàng)新，還會(huì)讓這些機(jī)構(gòu)的AI學(xué)生能夠使用該平臺(tái)來(lái)獲得行業(yè)急需的技能。它有助于向更多人開(kāi)放這項(xiàng)關(guān)鍵的先進(jìn)技術(shù)，而不僅僅是目前少數(shù)幾家權(quán)力掮客。

他說(shuō)：“我們從讓其他人能夠輕松地進(jìn)行實(shí)驗(yàn)和合作作為關(guān)鍵設(shè)計(jì)原則開(kāi)始。如果其他人不容易在彼此的工作基礎(chǔ)上進(jìn)行構(gòu)建，并且繼續(xù)在彼此的工作基礎(chǔ)上進(jìn)行構(gòu)建，那么開(kāi)源將永遠(yuǎn)無(wú)法實(shí)現(xiàn)它所需的增長(zhǎng)和速度。”

使AI技術(shù)更加開(kāi)放一直是業(yè)界一個(gè)棘手的問(wèn)題。如前所述，像Meta這樣的公司正在創(chuàng)建比一些競(jìng)爭(zhēng)對(duì)手更開(kāi)放的模型。開(kāi)源倡議在經(jīng)過(guò)多年的規(guī)劃后，于2024年10月發(fā)布了其開(kāi)源AI的初步定義，該定義涉及四種不同類型的數(shù)據(jù)，并要求構(gòu)建和贊助AI技術(shù)的公司共享他們可以共享的數(shù)據(jù)，以及模型的參數(shù)和用于訓(xùn)練和運(yùn)行系統(tǒng)的源代碼。隨著自主AI的興起，思科和其他廠商正在規(guī)劃通信網(wǎng)絡(luò)——他們稱之為“代理互聯(lián)網(wǎng)”——這將允許來(lái)自不同廠商和行業(yè)的AI代理自主連接和協(xié)作以解決復(fù)雜的問(wèn)題，并強(qiáng)調(diào)其需要開(kāi)源。

DeepSeek的出現(xiàn)

最近，中國(guó)人工智能初創(chuàng)公司DeepSeek本月發(fā)布了其DeepSeek-R1推理模型，該模型正在攪動(dòng)人工智能行業(yè)，因?yàn)樗鼡?jù)報(bào)道其性能與OpenAI的o1模型相當(dāng)——該模型可以在給出答案之前進(jìn)行推理——并且僅用560萬(wàn)美元在兩個(gè)月內(nèi)完成訓(xùn)練。它也是開(kāi)源的，因此人工智能開(kāi)發(fā)人員和研究人員可以合作并在其基礎(chǔ)上進(jìn)行構(gòu)建。

R1發(fā)布后，英偉達(dá)、微軟和其他人工智能巨頭的股票暴跌，DeepSeek將OpenAI從其在蘋(píng)果App Store上下載量最多的免費(fèi)應(yīng)用程序的寶座上擠下。

“DeepSeek的發(fā)布不可否認(rèn)地展示了開(kāi)源AI的巨大潛力，”安全開(kāi)發(fā)公司Black Duck的高級(jí)研發(fā)經(jīng)理說(shuō)。“通過(guò)在MIT許可下提供如此強(qiáng)大的模型，它不僅使人們能夠獲得最先進(jìn)的技術(shù)，而且還促進(jìn)了全球AI社區(qū)的創(chuàng)新和合作。”

然而，這位經(jīng)理表示，DeepSeek使用OpenAI的思維鏈數(shù)據(jù)進(jìn)行初始訓(xùn)練，這突顯了對(duì)透明度和共享資源的需求，并補(bǔ)充說(shuō)，“至關(guān)重要的是，底層的訓(xùn)練和評(píng)估數(shù)據(jù)必須是開(kāi)放的，初始架構(gòu)和生成的模型權(quán)重也必須是開(kāi)放的。”

DeepSeek助力開(kāi)源論證

表示，DeepSeek的成功驗(yàn)證了戰(zhàn)略。建立在Meta的Llama和PyTorch等其他開(kāi)源工作之上，使這家中國(guó)公司能夠進(jìn)行創(chuàng)新，并創(chuàng)建似乎正在縮小與OpenAI專有模型差距的模型。

DeepSeek建立在Meta的PyTorch和Llama等其他開(kāi)源工作之上。這些開(kāi)源工作使DeepSeek團(tuán)隊(duì)能夠繼續(xù)創(chuàng)新，并開(kāi)發(fā)出似乎正在縮小與OpenAI專有模型差距的模型。他表示，在一個(gè)像這樣的平臺(tái)上，社區(qū)可以共同構(gòu)建下一個(gè)DeepSeek。

表示，DeepSeek也應(yīng)該為美國(guó)敲響警鐘。

“盡管DeepSeek在數(shù)學(xué)和編碼等領(lǐng)域表現(xiàn)令人印象深刻，但其偏見(jiàn)和審查制度表明了人工智能發(fā)展未來(lái)的風(fēng)險(xiǎn)，”他說(shuō)。“為了讓美國(guó)繼續(xù)在人工智能領(lǐng)域保持領(lǐng)先地位，我們需要開(kāi)源和開(kāi)放合作來(lái)開(kāi)發(fā)值得信賴且可解釋的模型。如果美國(guó)比中國(guó)更不開(kāi)放，美國(guó)的研究人員將處于劣勢(shì)。”

溝通與協(xié)作

和稱之為一個(gè)正在推出第一個(gè)無(wú)條件開(kāi)源AI平臺(tái)的人工智能實(shí)驗(yàn)室。它提供具有開(kāi)放代碼、開(kāi)放數(shù)據(jù)和開(kāi)放權(quán)重的基礎(chǔ)模型，并為研究人員和開(kāi)發(fā)人員提供協(xié)作和貢獻(xiàn)的工具。它是一個(gè)統(tǒng)一的平臺(tái)，可以支持所有常見(jiàn)的基礎(chǔ)模型工作流程。

開(kāi)發(fā)人員可以使用SFT、LoRA、QLoRA和DPO等技術(shù)來(lái)訓(xùn)練各種規(guī)模的模型，從1000萬(wàn)到4050億個(gè)參數(shù)，獲得對(duì)PyTorch和其他AI工具的支持，使用文本和多模態(tài)模型，如Llama、通義千問(wèn)（由阿里云構(gòu)建的LLM系列）和微軟的Phi小型語(yǔ)言模型（SLM）。

他們可以使用vLLM和SGLang等多個(gè)推理引擎，通過(guò)標(biāo)準(zhǔn)基準(zhǔn)評(píng)估模型，并在任何環(huán)境中運(yùn)行他們的模型，從他們自己的筆記本電腦到亞馬遜網(wǎng)絡(luò)服務(wù)和微軟Azure的云基礎(chǔ)設(shè)施，再到谷歌云平臺(tái)和Lambda。此外，開(kāi)發(fā)人員可以將他們的模型與來(lái)自O(shè)penAI、Anthropic、谷歌的Vertex AI和其他公司的開(kāi)放模型或商業(yè)API集成。

它還原生支持Jupyter筆記本和Microsoft Visual Studio代碼調(diào)試。還包括用于各種操作（包括訓(xùn)練后操作）的預(yù)構(gòu)建工作流程和配方。 “當(dāng)有新項(xiàng)目時(shí)，當(dāng)他們有研究想法時(shí)，他們想執(zhí)行它，”Elachqar告訴The New Stack。“但是，他們必須弄清楚很多事情才能測(cè)試這個(gè)想法，這個(gè)假設(shè)。我們?yōu)樗麄兲峁┑氖亲畛Ｒ?jiàn)的流程，他們需要微調(diào)模型或生成數(shù)據(jù)或進(jìn)行推理。我們?yōu)樗麄兲峁┓浅？煽康钠瘘c(diǎn)，他們可以使用并調(diào)整到他們的用例。”

押注正確的馬

Oumi的創(chuàng)始人表示，該行業(yè)向真正的開(kāi)源發(fā)展，遠(yuǎn)離公司幕后構(gòu)建的一次性AI模型至關(guān)重要。創(chuàng)新將更快地發(fā)生，并且將有更多可用的人才可以使用，他們相信生態(tài)系統(tǒng)中的參與者——從云提供商到加速器供應(yīng)商，再到小型公司和研究機(jī)構(gòu)——都希望開(kāi)源AI能夠成功。

Elachqar說(shuō)，資源最多的公司無(wú)法獨(dú)自解決挑戰(zhàn)，并指出他和Koukoumidis與這些供應(yīng)商多年的經(jīng)驗(yàn)。開(kāi)放協(xié)作至關(guān)重要；否則，AI開(kāi)發(fā)人員將在孤島中工作，創(chuàng)建與其他人相同的工具，而不是在已完成的工作的基礎(chǔ)上進(jìn)行構(gòu)建。

這也將保護(hù)行業(yè)本身。Koukoumidis預(yù)計(jì)許多公司在未來(lái)幾年內(nèi)將崩潰，這些公司正在制作封閉模型。他提到了Inflection AI，這家初創(chuàng)公司直到去年年底還在推出管理人員所說(shuō)的可能挑戰(zhàn)領(lǐng)導(dǎo)者的模型。現(xiàn)在它已經(jīng)退出了模型構(gòu)建游戲，轉(zhuǎn)向創(chuàng)建企業(yè)可以使用其他人構(gòu)建的AI模型的工具。

首席執(zhí)行官說(shuō)：“比賽中有兩匹馬。”“有一匹閉源的馬說(shuō)，‘我需要自己做所有事情。我需要自己付出全部努力來(lái)開(kāi)發(fā)，我必須承擔(dān)這樣做的全部成本。’然后你有一匹開(kāi)源的馬，很多人都在為它提供資源。他們正在幫助它更快地移動(dòng)，它正在整合來(lái)自所有不同實(shí)體的所有貢獻(xiàn)——人力和金錢(qián)貢獻(xiàn)。問(wèn)題是，你認(rèn)為哪一個(gè)最終會(huì)更快、更經(jīng)濟(jì)可持續(xù)？我們押注第二匹馬。”

責(zé)任編輯：武曉燕來(lái)源：云云眾生s