成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DeepSeek沖擊下,百度的開源牌能打響嗎?

原創 精選
開源
歸根結底,百度開源的核心挑戰,不只是“開源與否”,而是開源后能否真正提升文心大模型的行業影響力。開源能帶來品牌聲量、生態繁榮,甚至用戶增長,但最終決定一切的,仍然是模型的技術實力和落地體驗。

編輯 | 伊風

出品 | 51CTO技術棧(微信號:blog51cto)

年初,DeepSeek-R1模型的開源讓這個低調的技術品牌一炮打響。

隨著DeepSeek應用的飛速增長,AI巨頭正在集體重新審視開源模式的商業價值——這不再只是“賠本賺吆喝”的事情,而是可能帶來實實在在的商業回報。

DeepSeek帶來的競爭壓力肉眼可見,連OpenAI的Altman都罕見地改口反思,承認OpenAI在開閉源問題上“站在了歷史錯誤的一端”。Altman 甚至在X上發起了投票,詢問大家OpenAI的下一個開源項目是一個o3 mini級的模型好,還是開源一個端側模型好。

而在國內,同樣坐不住的還有曾經的閉源信仰者——百度。2月中旬,百度接連拋出一系列大動作:

  • 2月11日,文小言(原文心一言)更新,新版本正式接入DeepSeek-R1模型;
  • 2月13日,百度宣布文心一言將于4月1日起全面免費;
  • 2月14日,百度官宣:未來幾個月將陸續推出文心大模型4.5系列,并計劃在6月30日正式開源。

其中最出人意料的,還是百度在“開源 vs. 閉源”問題上的180度轉向。曾經,李彥宏曾直言“開源大模型是智商稅”“開源模型只會越來越落后”,而如今,面對現實的百度卻決定“打不過就加入”,主動順應開源潮流。

不過,細品百度的開源計劃,會發現它與DeepSeek的開源或許仍有本質不同。DeepSeek采取的是“上線即開源”的模式,而百度的開源方案更顯謹慎:未來幾個月用戶或在產品側先行體驗文心4.5系列,但真正的開源要等到年中才正式落地。

而2025的下半年,才是百度的重頭戲。根據外媒CNBC的爆料,百度Ernie 5.0預計將在今年下半年發布,并在多模態能力上有重大增強。知情人士透露,新模型可能會在文本、圖像、視頻、音頻的理解和轉換上邁出更大步伐,例如生成更自然的AI視頻內容。

從某種程度看,百度的Ernie 4.5開源,很可能是在給 5.0“投石問路”。在全面邁入開源賽道之前,百度似乎更想先試探市場反應,看看這條路是否值得走到底。

1.月活被反超,百度系模型真落后了嗎?

關于百度的下次開源是否能激起水花,有一個繞不開的問題:百度在大模型的技術方面是否已經落后?

從技術方面看,百度可能與頭部模型廠商并未拉開太大差距。

但百度大模型失去競爭力的觀點一直充斥于網絡,究其原因有以下幾方面。

首先,作為國內最早入局者,百度文小言確實沒能守住第一的位置,再加上“起大早、趕晚集”的論調時不時就拿出來炒作一番,使得很多人覺得百度的大模型也會“爛尾”。

兩年前,百度是大廠中最早做大模型的,2023年3月就開始內測Chatbot應用文心一言,趕來嘗鮮的用戶擠滿了排隊列表。但文心一言在月活上的領先優勢只維持了一年之久,此后便逐漸被Kimi、豆包等一眾后來者反超。

不過,雖然AI應用的月活量無法完全反映一家模型廠的技術水平。目前,文心一言Web端的訪問量在國內AI產品位列第6,落后于DeepSeek和承接了DeepSeek流量的納米AI搜索、投流比較猛的豆包、Kimi以及非AI原生的百度文庫。僅從應用排名看,無法證明百度的技術存在大幅落后。

這里引出了第二個問題:百度文庫月活量的趕超以及在商業化上的亮眼表現,似乎多少給外界傳遞了一種文小言被內部放棄的信號。

例如,李彥宏1月初發的百度內部信中,提到“我們在大模型應用領域獨樹一幟,為4000萬文庫的付費用戶提供無與倫比的內容創作……”,卻未提及AI原生出身的文心一言。

需要明確的是,從應用層上,文小言在內部的地位是否滑落,我們不得而知。但模型層上,文心仍然是為百度文庫做賦能的技術基座,那就不存在被放棄的問題。

第三,百度的閉源生態和過早開啟的訂閱制度,要為百度日活被反超的事實“背一部分鍋”。

2023年11月,文心一言就開做會員收費,這意味著非付費用戶從此無法接觸最先進的文心4.0模型。百度悶聲掙大錢的態度忽視了必要的技術宣傳,甚至立場鮮明地支持閉源,發表一系列“開源模型只會越來越落后”的觀點。

此刻再宣布開源,很難給用戶好的觀感。

最后,由于重視商業化的策略,加上大模型“燒錢”的客觀現實,百度一度被傳出“預訓練終止”的消息。

圖片圖片

對此,百度CTO王海峰曾辟謠,表示“相信大家非常關心基礎大模型的進展。我可以很篤定地告訴大家,文心大模型仍在持續訓練中,敬請期待更強大的新版本?!?/span>

那么,有關基礎模型訓練的真相如何?百度開源還有機會嗎?

2.百度模型進展到哪了?守住了哪些優勢?

結合上一代模型ERNIE 4.0及其Turbo版的表現來看,百度再度躋身第一、第二梯隊還是有希望的。

百度發布于2023年10月的ERNIE 4.0(比GPT4晚發布7個月)及2024年6月升級的ERNIE 4.0 Turbo(比GPT-4o晚發布一個月),代表了百度最先進的模型技術。

ERNIE 4.0有明確對標GPT-4,且綜合實力相當。比起后者,ERNIE 4.0在中文語境下的表現相對更優,但在復雜邏輯任務上遜色于后者。

圖片圖片

而去年6月發布的ERNIE 4.0 Turbo,則缺少明確的對標對象,官方介紹說“在性能上實現了顯著提升”。

根據智源研究院12月19日的FlagEval“百?!痹u測結果,ERNIE 4.0 Turbo確實在主觀評分上處于領先地位,僅次于幾乎同期發布的Doubao-pro-32k-preview,但客觀估分不高。

以上表明文心可能是個“重文輕理”的模型。

上圖:智源研究院 FlagEval“百?!痹u測結果上圖:智源研究院 FlagEval“百模”評測結果

雖然缺乏公開宣傳,但百度也沒有停止模型更新的步伐。

從百度千帆大模型服務與開發平臺,查看模型的更新記錄,會發現百度的1月底,同樣忙著做推理能力,并甩了一堆的模型更新。

上圖:百度千帆大模型服務與開發平臺上圖:百度千帆大模型服務與開發平臺

https://ai.baidu.com/ai-doc/WENXINWORKSHOP/flxu4ej5u

性能方面,在SuperCLUE的第三方報告中,百度一個名為“ERNIE-4.0-Turbo-8K-Latest”的模型,總分62.2,位列該報告模型的“第四梯隊”。從命名看出,這是一個相當強悍的8K小模型。這個模型與DeepSeek-V2.5保持在同一梯隊中,并且優于GPT-4o-mini。

注:以上數據來自SuperCLUE注:以上數據來自SuperCLUE

此外,百度在垂直場景和多模態技術上也有顯著優勢。

商業化并不意味著沒有技術積累,深耕的垂直場景也可能給百度模型帶來有價值的反哺,尤其是專業的高質量數據。

從官網給出的產業級大模型分布圖來看,百度已經在多個行業有定制模型。據報道,百度文心模型在中文場景下的知識問答、多模態生成(文本、圖像、語音)能力領先,尤其在金融與教育領域的應用成熟度高。

上圖來源:文心大模型官網上圖來源:文心大模型官網

百度最新發布的24年財報中透露,“12月,文心大模型日均調用量達16.5億次,一年增長33倍?!庇纱丝梢?,百度在商業化場景上有獨特的技術積累,有很強的可信性。

在多模態領域,蘋果的合作選擇或許正是百度優勢的一種側面印證。盡管蘋果最終攜手阿里打造國行AI功能,但據外媒報道,其AI圖片識別功能的開發仍選擇了百度作為合作伙伴。

圖片


此外,文心還是國家跳水隊的選擇。百度文心開發了一套智能跳水輔助訓練系統,可以給跳水運動員的動作實時打分、進行精準量化分析、制訂訓練計劃等等。

百度的CTO王海峰曾談過多模態的技術壁壘。他表示“相比文字幻覺,圖片幻覺更為棘手”,百度進一步研發了檢索增強的文生圖技術,既可以生成精確的圖片,也可以進行泛化生圖。

更詳細的技術解釋是:大模型先基于用戶的需求進行分析理解,自動規劃精確或泛化方案,比如需對哪些實體進行增強;接著在增強階段,對需要增強的實體,檢索并選擇相應的參考圖。等到了生成階段,百度通過自研的多??煽厣鷪D大模型,一方面,通過局部注意力計算,在保持實體特征不變的情況下,實現圖像的高泛化生成,比如根據牛頓的肖像,生成繪本風格的牛頓;另一方面,通過整體注意力計算,進行高精確的圖像生成,比如生成圖中的汽車跟原圖片完全一致。

再加上多模態也是Ernie 5.0的最重要的亮點,或許百度在這個維度上有所突破,還有些“壓箱底”的技術也不是沒有可能。(有趣的是,同為搜索引擎巨頭的谷歌,其主要優勢也集中在了多模態技術,且最近發布的Gemini 2.0性能可圈可點。)

此外,百度在算力層上能真正做到軟硬協同。其自研芯片(昆侖芯)與自研框架(飛槳PaddlePaddle)深度適配,能顯著提升算力利用率。今年2月,百度還宣布百度智能云已經成功點亮昆侖芯三代萬卡集群,這也是國內首個正式點亮的自研萬卡集群。并透露了下一步,百度智能云將進一步點亮3萬卡集群。

這不僅為文心大模型迭代提供了足量的"彈藥",更長遠的看,百度的方案不依賴英偉達芯片,提前規避了風險,或能在國產替代浪潮中占據關鍵生態位。

3.百度發力開源,究竟能不能成為解藥?

DeepSeek效應持續發酵,海內外模型廠商無不受到震撼。

一部分模型廠商重新回歸了技術驅動的路線,例如“六小虎”中的Kimi、MiniMax等等。

在DeepSeek開源并取得巨大成功后,月之暗面內部重新評估其戰略,團隊復盤后認為應堅持基礎模型SOTA(State-of-the-art,當前最佳)的目標。

而MiniMax的CEO閆俊杰也在采訪中透露,在經歷了整整半年多的焦慮后,他終于做出取舍“現在 MiniMax 最重要的目標不是增長,也不是收入,是 ‘加速技術迭代’?!?/span>

另一部分模型廠商則重拾了開源計劃,例如OpenAI。Altman透露了未來可能的開源項目,且提供的選項都很具吸引力。

以上兩個分類當然存在重合,但值得注意的是:開源并不等同于技術驅動。

促使公司開源的動力有很多。閆俊杰說,“如果重新選,第一天就應該開源。因為開源能加速技術進化?!钡荄eepSeek的奇跡也驗證了——開源的價值遠比我們想象的更深遠、更多元:開源可以打造一個技術品牌;開源可以為模型贏得美譽和口碑;開源甚至能成為一個比B端大客戶銷售團隊更有效的商業化引擎。

百度當然也看到了開源的價值。在18日財報會上,李彥宏坦言,DeepSeek的成功給百度上了一課:“從DeepSeek身上,我們學到了一件事,那就是開源最佳模型能大大促進人們使用或采納這個模型。當一個模型開源時,人們自然會出于好奇想嘗試,這有助于更廣泛的采用。文心大模型4.5將是我們有史以來最好的模型,我們希望用戶和客戶能夠比以往更輕松地試用?!?/span>

因此,百度選擇趁早官宣了6月30日文心4.5系列的開源,希望借此降低用戶使用門檻,推動生態繁榮。

但開源并非簡單的“技術開放”那么直接,它牽涉到商業策略、生態布局,甚至隱私與安全邊界的考量。相比此前未發力應用的DeepSeek,百度文心已經積累了龐大的C端用戶,模型訓練可能涉及用戶交互數據以及百度自身的搜索、云計算等數據資產,因此在開源時,必須考慮數據安全與合規性。

百度需要明確開源的邊界:是僅開放推理權重,還是進一步開放訓練方法?如何設定開源協議,既能鼓勵創新,又能確保數據不被濫用?這些都是影響開源效果的關鍵問題。

至于此前簽下的政企訂單,百度仍然可以通過私有化部署確保穩定性。事實上,開源與政企客戶并不沖突,合理的“開放但可控”策略,反而可能增強企業客戶的信任度。

歸根結底,百度開源的核心挑戰,不只是“開源與否”,而是開源后能否真正提升文心大模型的行業影響力。開源能帶來品牌聲量、生態繁榮,甚至用戶增長,但最終決定一切的,仍然是模型的技術實力和落地體驗。DeepSeek的爆發式增長,正是建立在這一前提之上的。百度能否在開源后抓住同樣的機會,還要看文心4.5的實際表現。

參考鏈接:

1.https://zhuanlan.zhihu.com/p/23667812307

2.https://finance.sina.com.cn/tech/discovery/2024-11-13/doc-incvxpff1200045.shtml

3.https://flageval.baai.ac.cn/#/home

4.https://cloud.tencent.com/developer/article/2495332

5.https://mp.weixin.qq.com/s/VmRFGJitPF9EXi0ZBDp3Pw

6.https://mp.weixin.qq.com/s/opWLjlQvWuf9mqKeP0D4Xg

7.https://cloud.baidu.com/article/3396976

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2022-03-02 11:04:45

百度業務盈利

2015-12-15 09:46:38

百度MTC開發測試

2014-07-25 17:12:39

數據庫WOT2014MongoDB

2013-08-22 17:08:50

2017-04-28 17:44:45

百度

2015-05-27 09:51:45

百度深度學習人工智能

2021-09-03 14:15:30

百度開源可視化

2018-07-04 12:25:50

智能小程序百度大腦

2012-11-16 11:01:50

移動搜索ASO

2018-07-31 15:34:27

開源

2014-09-04 02:25:24

百度世界大會2014直達號BaiduEye

2013-11-29 10:00:31

百度開源

2020-12-03 06:13:46

iOS

2010-08-31 09:16:55

軟件搜索百度

2019-11-21 10:56:24

開源技術 趨勢

2012-03-23 12:12:37

百度開發者大會

2012-05-28 22:51:53

百度

2013-11-04 17:38:09

Clouda百度

2012-05-24 13:55:02

XML

2018-09-06 18:37:45

百度云
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久草视频在 | 奇米在线| 午夜影院普通用户体验区 | 久久69精品久久久久久国产越南 | 91中文字幕在线 | 人人玩人人添人人澡欧美 | 国产在线1区 | 操视频网站 | 羞羞视频网页 | 欧美中文字幕在线观看 | 黄色免费在线网址 | 久久久tv| 日韩精品一区二区三区中文在线 | 国产午夜精品一区二区三区四区 | 午夜成人免费视频 | 精品国产不卡一区二区三区 | 国产1区2区3区 | www亚洲精品 | 国产精品入口久久 | 中文字幕综合 | 日韩视频一区在线观看 | 精品久久久av| 国产精品高潮呻吟久久 | 丁香久久 | 国产精品1区2区3区 欧美 中文字幕 | 噜噜噜噜狠狠狠7777视频 | 99热播精品 | 国产一区二区三区久久 | 亚洲 欧美 日韩 在线 | 狠狠综合久久av一区二区老牛 | 91色综合 | 日韩中文字幕一区 | 久久久久成人精品亚洲国产 | 国产一级一级毛片 | 国产成人免费一区二区60岁 | 亚洲午夜av久久乱码 | 日韩中文字幕在线视频 | 日韩av在线免费 | 浴室洗澡偷拍一区二区 | 国产精品久久久久久 | h片免费看 |