麥肯錫 & Mozilla:2025 人工智能時代下的開源技術研究報告
在當今科技飛速發展的宏大背景下,人工智能(AI)無疑是最引人矚目的驅動力之一,它正以前所未有的速度和深度滲透到各行各業,重塑著商業模式、社會結構乃至人類生活的方方面面。從自動化流程到復雜決策支持,從個性化服務到前沿科學探索,AI的應用場景日益廣泛,其戰略重要性已成為全球共識。
然而,支撐這場智能化革命的基石,并不僅僅是少數科技巨頭所掌握的尖端技術或龐大算力,一股同樣強大且日益重要的力量正在其中扮演著關鍵角色——那就是開源技術。開源軟件,以其協作開發、公開透明、自由使用、修改和分發的特性,長久以來一直是軟件技術生態系統的重要組成部分。它打破了傳統商業軟件的封閉模式,降低了創新門檻,促進了技術的普及與迭代。
如今,隨著AI技術的蓬勃發展,特別是生成式AI的突破性進展,開源模式再次展現出其獨特的價值和強大的生命力。眾多企業和開發者不再僅僅依賴于需要高昂許可費用且核心技術不透明的專有AI解決方案,而是將目光投向了日益豐富和成熟的開源AI技術棧。
這份由麥肯錫咨詢公司、Mozilla基金會以及帕特里克·J·麥戈文基金會(Patrick J. McGovern Foundation)聯合進行的研究報告——《人工智能時代下的開源技術》,正是基于這一時代背景,進行了一次前所未有的大規模、深度調研。
該研究旨在全面、細致地剖析全球范圍內企業和開發者在AI領域對開源技術的應用現狀、核心驅動因素、感知價值、面臨的風險挑戰以及未來發展趨勢。通過對來自41個國家、超過700位技術領導者和資深開發者的問卷調查(調研時間為2024年12月9日至2025年1月24日),報告首次為我們描繪了一幅關于開源AI在全球企業級應用中的詳盡圖景。
研究結果清晰地表明,開源AI不再是邊緣或補充性的選擇,而是正在迅速成為企業構建其AI能力、驅動創新、尋求競爭優勢的核心組成部分。從數據處理、模型訓練到工具應用,開源技術的身影無處不在,其影響力已深深嵌入現代AI技術棧的各個層面。報告強調,無論是商業領袖還是技術專家,都應充分認識并擁抱開源技術的巨大潛力,否則可能在未來的AI競爭格局中失去一個重要的戰略支點。
正如帕特里克·J·麥戈文基金會主席Vilas S. Dhar所言,開源通過將創造工具交到每個人手中,而非僅僅是資金雄厚者,從而將用戶轉變為建設者,將消費者轉變為創造者,它所代表的協作智能和自由流動的專業知識,將是解決人類最緊迫挑戰的關鍵。因此,理解并戰略性地運用開源AI,已成為企業在智能化時代生存和發展的必修課。
開源AI的應用現狀:廣泛滲透與結構性差異
報告深入探討了開源AI技術在企業實際應用中的普及程度和具體采用模式。研究首先界定了AI技術棧的七個關鍵領域:數據(用于訓練和評估模型)、模型(核心算法及權重)、托管/推理計算(運行模型的服務器或云基礎設施)、修改(如微調、適配器等,用于特定場景優化)、API與提示處理(使AI模型可用的接口)、工具(支持開發部署流程,如編排、安全、評估工具)以及用戶體驗/應用(最終面向用戶的AI產品)。
調研結果顯示,開源技術在AI技術棧的多個層面都實現了顯著的滲透。超過半數的受訪者表示,他們在數據、模型和工具這三個核心領域都不同程度地利用了開源技術。這反映出企業在構建其AI能力時,已經廣泛接受并采納了來自社區的開源資源。
特別是在模型層面,諸如Meta的Llama系列、Google的Gemma系列、艾倫人工智能研究所(Allen Institute for Artificial Intelligence)的OLMo系列,乃至Nvidia的NeMo系列、DeepSeek-R1和阿里巴巴的Qwen 2.5-Max等開源或部分開源模型,憑借其快速提升的性能,正在積極追趕甚至在某些基準測試中超越了部分專有模型,成為了企業的重要選擇。
然而,開源技術的應用并非在所有層面都均衡分布。在模型修改(如微調、適配器應用)以及托管/推理計算方面,開源技術的采用率相對較低。報告分析認為,這可能與相關領域的開源項目相對較新有關,例如,備受關注的推理引擎vLLM是在2024年4月才由伯克利大學Sky計算實驗室開發出來。同時,這也可能意味著企業更傾向于使用內部開發的工具包和專有數據來對模型進行定制化修改,以滿足其特定的業務需求和安全合規考量。
在探討“開放”程度時,報告特別關注了AI模型的復雜性所引發的關于“開源”定義的討論。Mozilla基金會支持開源促進會(OSI)提出的開源AI定義,該定義要求在數據信息、代碼和參數等多個維度都達到開放標準。調研中,符合OSI標準的被視為“開源”,而那些擁有開放組件(如開放權重)但不完全滿足OSI標準的(例如存在商業使用限制或未使用OSI批準的開源許可證)則被歸類為“部分開放”。
有趣的是,調研發現,受訪者最常選擇使用的是“部分開放”的模型。這在很大程度上反映了當前的市場格局——許多知名且資源雄厚的模型,如Llama 3和4系列,以及Stable Diffusion等,屬于此類。它們雖然在權重上開放,但在數據透明度或使用許可上可能存在限制,但這并未阻礙它們成為企業實踐中的熱門選項。
報告還揭示了開源AI應用在不同行業和地區之間的顯著差異??萍?、媒體和電信(TMT)行業是開源AI應用的領頭羊,其使用率高達70%。這可能得益于該行業天然的技術基因、對新技術的敏感度以及相對成熟的技術基礎設施。
相比之下,其他行業的應用程度雖也普遍,但存在梯度差異。從地域上看,印度(77%)和英國(75%)的受訪者報告的開源AI模型使用率最高,美國(62%)、法國(60%)、巴西(63%)等也表現出較高的采用水平。
此外,報告發現,技術成熟度和開發者經驗對開源AI的使用有著重要影響。擁有豐富AI開發經驗的開發者使用開源技術的可能性要高出40%。這表明,有效地利用開源AI資源,往往需要一定的技術門檻和實踐積累。
價值感知與權衡:成本、性能、效率與開發者體驗
企業和開發者之所以積極擁抱開源AI,其背后有著多重價值驅動因素。報告對此進行了深入分析,并將其與專有AI解決方案進行了對比。最突出的優勢之一是成本效益。高達60%的受訪者認為,開源AI的實施成本低于專有方案;46%的受訪者認為其維護成本更低;51%的受訪者認為相關的軟件工具成本也更低。這對于預算有限或希望優化IT支出的企業而言,無疑具有巨大的吸引力。開源模式通常免除了高昂的許可費用,并允許企業根據自身需求靈活調整和部署,從而有效控制總體擁有成本。
除了成本優勢,性能和易用性也是用戶選擇開源AI的重要原因。報告指出,絕大多數受訪者對他們使用的開源AI模型表示滿意,滿意者數量是表示不滿意者的近十倍。其中,高性能和易于使用是驅動滿意度的首要因素。這表明,許多開源AI項目在技術上已經達到了相當高的水準,能夠滿足企業在實際應用中的性能要求,并且其接口和文檔也越來越友好,降低了開發者的使用門檻。社區驅動的快速迭代和創新,也使得開源模型能夠緊跟技術前沿,不斷提升能力。
然而,開源AI并非完美無缺。在“價值實現時間”(time to value)方面,專有工具似乎更具優勢。有48%的受訪者認為專有工具能夠更快地帶來價值,而僅有33%的受訪者認為開源工具在這方面表現更好。這可能與專有解決方案通常提供更完善的集成服務、技術支持以及開箱即用的特性有關,使得企業能夠更快地將AI能力部署到業務流程中并產生回報。
相比之下,使用開源工具可能需要企業投入更多的內部資源進行集成、調試和優化。此外,雖然開源工具在用戶友好性方面獲得了30%受訪者的認可,但仍有41%的受訪者認為專有工具更易用,這表明開源社區在提升用戶體驗方面仍有改進空間。
對于開發者而言,開源AI的價值則體現在更深層次的職業發展和工作滿意度上。高達81%的開發者表示,擁有開源工具的經驗在他們的領域受到高度重視。這意味著掌握和運用開源AI技術已成為提升開發者市場競爭力的重要砝碼。
同時,66%的開發者認為,使用開源工具對他們的工作滿意度至關重要或非常重要。這反映了開源文化所倡導的開放、協作、共享精神,以及能夠直接接觸、修改和貢獻底層技術的自由度,對技術人員具有強烈的吸引力。他們不僅是技術的使用者,更是社區的參與者和貢獻者,這種歸屬感和成就感是專有技術生態系統難以比擬的。
因此,企業在選擇AI技術路徑時,需要在開源與專有之間進行審慎的權衡。開源提供了顯著的成本優勢、有競爭力的性能以及對開發者的強大吸引力,但在價值實現速度和某些情況下的易用性方面可能稍遜一籌。理解這些差異,并結合自身的業務需求、技術能力和風險偏好,做出明智的決策至關重要。
未來展望與風險管理:增長預期、混合策略與安全挑戰
展望未來,報告揭示了開源AI持續增長的強勁勢頭。高達75%的受訪者預計,他們的組織將在未來幾年內增加對開源AI技術的使用。這一普遍預期反映了市場對開源價值的廣泛認可,以及對其未來發展的充足信心。隨著開源模型性能的不斷提升、工具生態的日益完善以及社區的持續活躍,開源AI有望在更廣泛的領域和更深層次的應用中扮演更加核心的角色。
2024年見證了開源AI領域的諸多里程碑事件,例如Meta的Llama 3在基準測試中表現優異,DeepSeek-V3在推理速度上媲美頂級專有系統,蘋果(OpenELM)、微軟(Phi-3-mini)等巨頭也紛紛加大開源力度,這些都為開源AI的未來發展注入了強大動力。
然而,報告同時指出,未來的AI技術格局并非非黑即白的選擇,而更可能是一種混合模式的共存。近四分之三(超過70%)的受訪者表示,他們在AI技術棧的各個層面都對采用開源或專有技術持開放態度。極少有受訪者是純粹的開源或專有擁護者。這意味著企業將根據不同場景的具體需求,靈活地組合使用開源和專有組件,構建混合式的AI解決方案。
例如,可能會在成本敏感或需要高度定制化的場景中使用開源模型和工具,而在需要快速部署、強力支持或特定高性能要求的場景中選擇專有方案。這種“混合云”式的策略,將有助于企業在利用開源優勢的同時,彌補其短板,實現整體效益的最大化。正如Mozilla基金會主席Mark Surman所強調的,開源AI的目標是構建像“AI樂高盒子”一樣易于使用的工具和技術棧,使其成為更具競爭力、創造力和創新性未來的基礎,而非僅僅是封閉系統的替代品。
盡管前景光明,開源AI的發展并非沒有隱憂。風險管理是企業在采用開源技術時必須面對的關鍵課題。報告顯示,受訪者普遍認為開源AI工具在某些方面比專有AI風險更高。最受關注的風險領域包括:網絡安全(62%的受訪者表示擔憂)、法規遵從性(54%)和知識產權問題(50%)。
這些擔憂不無道理。開源軟件的開放性可能使其更容易受到惡意攻擊或被發現漏洞;復雜的許可證和貢獻者協議可能帶來合規和IP方面的挑戰;模型訓練數據的來源和質量問題也可能引發偏見、隱私泄露或版權爭議。值得注意的是,不同國家和地區的受訪者對風險的感知程度存在差異。例如,巴西受訪者更關注網絡安全,而印度受訪者則對法規遵從性和知識產權侵權的擔憂程度顯著高于全球平均水平,這可能與其特定的監管環境、風險容忍度和AI成熟度有關。
為了應對這些潛在挑戰,企業正在積極采取一系列風險緩解措施。報告中提到了幾種關鍵策略:
一是建立強健的“護欄”(Guardrails),例如使用自動化內容過濾、輸入/輸出驗證、人工監督等機制,確保AI模型的使用符合倫理和法規要求,并控制輸出的安全性。諸如Nvidia的NeMo Guardrails、Llama Guard等開源工具本身也提供了這方面的支持。
二是進行第三方評估,通過標準化的基準測試和認證,特別是采用隱私保護的評估方法(如私有基準測試),來確保模型的可靠性和安全性,防止數據污染。
三是加強文檔管理和監控,例如使用軟件物料清單(SBOM)來跟蹤開源組件的版本和已知漏洞,利用通用漏洞評分系統(CVSS)等工具評估風險嚴重性。
四是強化網絡安全實踐,包括在可信執行環境(TEE)中運行模型以保護敏感數據,在訓練中采用差分隱私和聯邦學習技術防止數據記憶,實施嚴格的訪問控制、網絡隔離、持續安全監控以及加密哈希驗證等。正如安全與技術研究所(Institute for Security and Technology)CEO Philip Reiner所建議的,組織需要回歸基本的網絡安全原則,重視開源工具可能存在的維護不足和軟件過時問題,并設立專門團隊負責風險跟蹤和更新。
此外,報告還指出了一個值得關注的現象:盡管開源AI的使用日益廣泛,但企業對開源項目的貢獻率卻相對較低。只有13%的受訪者表示他們曾為開源項目做出過貢獻,而50%的人不確定未來是否會參與。
貢獻意愿低可能源于多種因素,包括資源投入、知識產權顧慮以及貢獻行為往往更多基于利他主義而非直接商業回報。然而,一個健康繁榮的開源生態系統離不開包括企業、學術機構和基金會在內的多方參與和貢獻。缺乏廣泛的貢獻可能會限制開源技術在某些前沿領域的突破速度,并影響其長期可持續發展。因此,如何激勵和促進更廣泛的社區參與和企業貢獻,將是開源AI未來發展需要思考的重要議題。
結語:將開源AI融入企業核心戰略
麥肯錫與Mozilla基金會、帕特里克·J·麥戈文基金會聯合發布的這份《人工智能時代下的開源技術》報告,以其詳實的數據和深入的分析,為我們揭示了開源AI在全球企業應用中的真實圖景及其深遠影響。
報告的核心結論是明確而有力的:開源技術已經不再是AI領域的邊緣選擇或備用方案,而是正在成為驅動創新、降低成本、吸引人才、構建差異化競爭優勢的關鍵要素。企業對開源AI的采納已相當普遍,覆蓋了從數據處理、模型訓練到應用工具的整個技術棧,并且未來幾年內有望持續增長。開源AI在成本效益、性能表現以及開發者社區吸引力方面展現出顯著優勢,盡管在價值實現速度和某些風險感知上可能面臨挑戰。
面對開源AI帶來的機遇與挑戰,報告為企業決策者和技術領導者提供了清晰的指引。首先,企業應將開源AI視為其整體AI戰略不可或缺的一部分,積極評估和擁抱開源技術帶來的可能性。其次,應采取務實和靈活的混合策略,根據具體業務需求和場景特點,在開源與專有解決方案之間做出明智的組合與權衡。
再次,必須高度重視并有效管理開源AI相關的風險,特別是網絡安全、合規性和知識產權方面,建立完善的風險評估、緩解機制和治理框架。最后,企業也應考慮如何更積極地參與和貢獻于開源社區,這不僅有助于提升自身技術能力和品牌形象,更能促進整個生態系統的健康發展,最終惠及自身。
總之,人工智能時代已經到來,而開源正以前所未有的力量塑造著這個時代的科技格局。那些能夠深刻理解、戰略性運用并有效管理開源AI的企業,無疑將在未來的智能化競爭中占據更有利的位置。這份報告不僅是對現狀的一次全面掃描,更是對未來趨勢的一次深刻洞察,為所有希望在AI浪潮中乘風破浪的組織提供了寶貴的參考和啟示。
本文轉載自???歐米伽未來研究所???,作者:歐米伽未來研究所
