開(kāi)源AI的承諾兌現(xiàn)
初創(chuàng)公司Oumi已走出隱身模式,獲得1000萬(wàn)美元融資,并推出其高管稱之為真正開(kāi)源的AI平臺(tái)。
譯自Making Good on the Promise of Open Source AI,作者 Jeffrey Burt。
兩年多前,OpenAI發(fā)布其ChatGPT聊天機(jī)器人,開(kāi)啟了生成式AI](https://thenewstack.io/generative-ai-in-2023-genai-tools-became-table-stakes/)時(shí)代,此后發(fā)展迅速,AI行業(yè)似乎一直在試圖定義“開(kāi)放”和“開(kāi)源”在這一時(shí)代中的含義。
AI領(lǐng)域主要由少數(shù)幾家資金雄厚的大公司及其AI模型和工具主導(dǎo),例如OpenAI的GPT系列模型、微軟的Copilot和谷歌的Gemini。其他公司,其中Meta憑借其Llama模型最為引人注目,都吹噓自己是開(kāi)放的,盡管一些批評(píng)者質(zhì)疑它們到底有多開(kāi)放。
然而,除了關(guān)于定義的爭(zhēng)論之外,缺乏真正廣泛使用的開(kāi)源AI平臺(tái)正在阻礙行業(yè)創(chuàng)新,并造成令人不安的人才缺口假象,曾在谷歌、微軟和Meta等巨頭公司從事AI技術(shù)工作的Manos Koukoumidis表示。
“通常情況下,人們發(fā)布開(kāi)放權(quán)重模型,只是模型本身和權(quán)重,”Koukoumidis告訴The New Stack。“[人們]不知道它是如何開(kāi)發(fā)的,使用了什么代碼,使用了什么數(shù)據(jù),他們稱之為開(kāi)源,但這并不是一個(gè)非常準(zhǔn)確的描述。現(xiàn)實(shí)情況是,即使是目前的努力,即使是少數(shù)開(kāi)源的——因?yàn)镸eta的‘開(kāi)放權(quán)重’——即使是少數(shù)開(kāi)源的,人們也很難進(jìn)行實(shí)驗(yàn),繼續(xù)創(chuàng)新并在此工作上相互合作。這是阻礙開(kāi)源世界進(jìn)步的事情。”
正是這一點(diǎn)促使Koukoumidis和Oussama Elachqar——他在微軟、蘋(píng)果和推特(現(xiàn)為X)擁有機(jī)器學(xué)習(xí)經(jīng)驗(yàn)——啟動(dòng)了Oumi,這是一家今天剛剛走出隱身模式的初創(chuàng)公司,它提供兩者都稱之為真正開(kāi)源平臺(tái)的東西。它還獲得了由風(fēng)險(xiǎn)投資公司Venrock和Obvious Ventures領(lǐng)投的1000萬(wàn)美元種子資金。
AI的Linux
Koukoumidis,同時(shí)也是Oumi的首席執(zhí)行官,表示該平臺(tái)——與來(lái)自11家機(jī)構(gòu)的研究人員合作開(kāi)發(fā),包括麻省理工學(xué)院(MIT)、加州大學(xué)伯克利分校和卡內(nèi)基梅隆大學(xué)——基本上充當(dāng)AI模型和工具的Linux,使研究人員、開(kāi)發(fā)人員和AI專家能夠廣泛合作和貢獻(xiàn),他們將能夠在彼此的工作基礎(chǔ)上進(jìn)行構(gòu)建。
這不僅會(huì)加速創(chuàng)新,還會(huì)讓這些機(jī)構(gòu)的AI學(xué)生能夠使用該平臺(tái)來(lái)獲得行業(yè)急需的技能。它有助于向更多人開(kāi)放這項(xiàng)關(guān)鍵的先進(jìn)技術(shù),而不僅僅是目前少數(shù)幾家權(quán)力掮客。
他說(shuō):“我們從讓其他人能夠輕松地進(jìn)行實(shí)驗(yàn)和合作作為關(guān)鍵設(shè)計(jì)原則開(kāi)始。如果其他人不容易在彼此的工作基礎(chǔ)上進(jìn)行構(gòu)建,并且繼續(xù)在彼此的工作基礎(chǔ)上進(jìn)行構(gòu)建,那么開(kāi)源將永遠(yuǎn)無(wú)法實(shí)現(xiàn)它所需的增長(zhǎng)和速度。”
使AI技術(shù)更加開(kāi)放一直是業(yè)界一個(gè)棘手的問(wèn)題。如前所述,像Meta這樣的公司正在創(chuàng)建比一些競(jìng)爭(zhēng)對(duì)手更開(kāi)放的模型。開(kāi)源倡議在經(jīng)過(guò)多年的規(guī)劃后,于2024年10月發(fā)布了其開(kāi)源AI的初步定義,該定義涉及四種不同類型的數(shù)據(jù),并要求構(gòu)建和贊助AI技術(shù)的公司共享他們可以共享的數(shù)據(jù),以及模型的參數(shù)和用于訓(xùn)練和運(yùn)行系統(tǒng)的源代碼。 隨著自主AI的興起,思科和其他廠商正在規(guī)劃通信網(wǎng)絡(luò)——他們稱之為“代理互聯(lián)網(wǎng)”——這將允許來(lái)自不同廠商和行業(yè)的AI代理自主連接和協(xié)作以解決復(fù)雜的問(wèn)題,并強(qiáng)調(diào)其需要開(kāi)源。
DeepSeek的出現(xiàn)
最近,中國(guó)人工智能初創(chuàng)公司DeepSeek本月發(fā)布了其DeepSeek-R1推理模型,該模型正在攪動(dòng)人工智能行業(yè),因?yàn)樗鼡?jù)報(bào)道其性能與OpenAI的o1模型相當(dāng)——該模型可以在給出答案之前進(jìn)行推理——并且僅用560萬(wàn)美元在兩個(gè)月內(nèi)完成訓(xùn)練。它也是開(kāi)源的,因此人工智能開(kāi)發(fā)人員和研究人員可以合作并在其基礎(chǔ)上進(jìn)行構(gòu)建。
R1發(fā)布后,英偉達(dá)、微軟和其他人工智能巨頭的股票暴跌,DeepSeek將OpenAI從其在蘋(píng)果App Store上下載量最多的免費(fèi)應(yīng)用程序的寶座上擠下。
“DeepSeek的發(fā)布不可否認(rèn)地展示了開(kāi)源AI的巨大潛力,”安全開(kāi)發(fā)公司Black Duck的高級(jí)研發(fā)經(jīng)理說(shuō)。“通過(guò)在MIT許可下提供如此強(qiáng)大的模型,它不僅使人們能夠獲得最先進(jìn)的技術(shù),而且還促進(jìn)了全球AI社區(qū)的創(chuàng)新和合作。”
然而,這位經(jīng)理表示,DeepSeek使用OpenAI的思維鏈數(shù)據(jù)進(jìn)行初始訓(xùn)練,這突顯了對(duì)透明度和共享資源的需求,并補(bǔ)充說(shuō),“至關(guān)重要的是,底層的訓(xùn)練和評(píng)估數(shù)據(jù)必須是開(kāi)放的,初始架構(gòu)和生成的模型權(quán)重也必須是開(kāi)放的。”
DeepSeek助力開(kāi)源論證
表示,DeepSeek的成功驗(yàn)證了戰(zhàn)略。建立在Meta的Llama和PyTorch等其他開(kāi)源工作之上,使這家中國(guó)公司能夠進(jìn)行創(chuàng)新,并創(chuàng)建似乎正在縮小與OpenAI專有模型差距的模型。
DeepSeek建立在Meta的PyTorch和Llama等其他開(kāi)源工作之上。這些開(kāi)源工作使DeepSeek團(tuán)隊(duì)能夠繼續(xù)創(chuàng)新,并開(kāi)發(fā)出似乎正在縮小與OpenAI專有模型差距的模型。他表示,在一個(gè)像這樣的平臺(tái)上,社區(qū)可以共同構(gòu)建下一個(gè)DeepSeek。
表示,DeepSeek也應(yīng)該為美國(guó)敲響警鐘。
“盡管DeepSeek在數(shù)學(xué)和編碼等領(lǐng)域表現(xiàn)令人印象深刻,但其偏見(jiàn)和審查制度表明了人工智能發(fā)展未來(lái)的風(fēng)險(xiǎn),”他說(shuō)。“為了讓美國(guó)繼續(xù)在人工智能領(lǐng)域保持領(lǐng)先地位,我們需要開(kāi)源和開(kāi)放合作來(lái)開(kāi)發(fā)值得信賴且可解釋的模型。如果美國(guó)比中國(guó)更不開(kāi)放,美國(guó)的研究人員將處于劣勢(shì)。”
溝通與協(xié)作
和稱之為一個(gè)正在推出第一個(gè)無(wú)條件開(kāi)源AI平臺(tái)的人工智能實(shí)驗(yàn)室。它提供具有開(kāi)放代碼、開(kāi)放數(shù)據(jù)和開(kāi)放權(quán)重的基礎(chǔ)模型,并為研究人員和開(kāi)發(fā)人員提供協(xié)作和貢獻(xiàn)的工具。它是一個(gè)統(tǒng)一的平臺(tái),可以支持所有常見(jiàn)的基礎(chǔ)模型工作流程。
開(kāi)發(fā)人員可以使用SFT、LoRA、QLoRA和DPO等技術(shù)來(lái)訓(xùn)練各種規(guī)模的模型,從1000萬(wàn)到4050億個(gè)參數(shù),獲得對(duì)PyTorch和其他AI工具的支持,使用文本和多模態(tài)模型,如Llama、通義千問(wèn)(由阿里云構(gòu)建的LLM系列)和微軟的Phi小型語(yǔ)言模型(SLM)。
他們可以使用vLLM和SGLang等多個(gè)推理引擎,通過(guò)標(biāo)準(zhǔn)基準(zhǔn)評(píng)估模型,并在任何環(huán)境中運(yùn)行他們的模型,從他們自己的筆記本電腦到亞馬遜網(wǎng)絡(luò)服務(wù)和微軟Azure的云基礎(chǔ)設(shè)施,再到谷歌云平臺(tái)和Lambda。此外,開(kāi)發(fā)人員可以將他們的模型與來(lái)自O(shè)penAI、Anthropic、谷歌的Vertex AI和其他公司的開(kāi)放模型或商業(yè)API集成。
它還原生支持Jupyter筆記本和Microsoft Visual Studio代碼調(diào)試。還包括用于各種操作(包括訓(xùn)練后操作)的預(yù)構(gòu)建工作流程和配方。 “當(dāng)有新項(xiàng)目時(shí),當(dāng)他們有研究想法時(shí),他們想執(zhí)行它,”Elachqar告訴The New Stack。“但是,他們必須弄清楚很多事情才能測(cè)試這個(gè)想法,這個(gè)假設(shè)。我們?yōu)樗麄兲峁┑氖亲畛R?jiàn)的流程,他們需要微調(diào)模型或生成數(shù)據(jù)或進(jìn)行推理。我們?yōu)樗麄兲峁┓浅?煽康钠瘘c(diǎn),他們可以使用并調(diào)整到他們的用例。”
押注正確的馬
Oumi的創(chuàng)始人表示,該行業(yè)向真正的開(kāi)源發(fā)展,遠(yuǎn)離公司幕后構(gòu)建的一次性AI模型至關(guān)重要。創(chuàng)新將更快地發(fā)生,并且將有更多可用的人才可以使用,他們相信生態(tài)系統(tǒng)中的參與者——從云提供商到加速器供應(yīng)商,再到小型公司和研究機(jī)構(gòu)——都希望開(kāi)源AI能夠成功。
Elachqar說(shuō),資源最多的公司無(wú)法獨(dú)自解決挑戰(zhàn),并指出他和Koukoumidis與這些供應(yīng)商多年的經(jīng)驗(yàn)。開(kāi)放協(xié)作至關(guān)重要;否則,AI開(kāi)發(fā)人員將在孤島中工作,創(chuàng)建與其他人相同的工具,而不是在已完成的工作的基礎(chǔ)上進(jìn)行構(gòu)建。
這也將保護(hù)行業(yè)本身。Koukoumidis預(yù)計(jì)許多公司在未來(lái)幾年內(nèi)將崩潰,這些公司正在制作封閉模型。他提到了Inflection AI,這家初創(chuàng)公司直到去年年底還在推出管理人員所說(shuō)的可能挑戰(zhàn)領(lǐng)導(dǎo)者的模型。現(xiàn)在它已經(jīng)退出了模型構(gòu)建游戲,轉(zhuǎn)向創(chuàng)建企業(yè)可以使用其他人構(gòu)建的AI模型的工具。
首席執(zhí)行官說(shuō):“比賽中有兩匹馬。”“有一匹閉源的馬說(shuō),‘我需要自己做所有事情。我需要自己付出全部努力來(lái)開(kāi)發(fā),我必須承擔(dān)這樣做的全部成本。’然后你有一匹開(kāi)源的馬,很多人都在為它提供資源。他們正在幫助它更快地移動(dòng),它正在整合來(lái)自所有不同實(shí)體的所有貢獻(xiàn)——人力和金錢(qián)貢獻(xiàn)。問(wèn)題是,你認(rèn)為哪一個(gè)最終會(huì)更快、更經(jīng)濟(jì)可持續(xù)?我們押注第二匹馬。”