提前免費(fèi)!百度一口氣上線文心4.5和X1!實(shí)力震驚硅谷!API價(jià)格又打下來了,R1還得對(duì)半砍! 原創(chuàng)
編輯 |伊風(fēng)、言征
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
百度的步伐也是加速了!
原本計(jì)劃4月1日免費(fèi)的文心大模型4.5,在兩周年之際就提前登場(chǎng)。
不僅如此,3月16日,百度搞了個(gè)“兩連發(fā)”,一口氣開放了兩款模型文心大模型4.5和文心大模型X1。
目前均在官網(wǎng)免費(fèi)向用戶開放了!百度還貼心的給了精煉的模型介紹,以方便用戶選擇合適的模型。文心X1的介紹是“深度思考,更聰明”;文心4.5的介紹是“效果出色,更全能”。
圖片
(https://yiyan.baidu.com)
文心大模型4.5的“全能”,具體體現(xiàn)在多模態(tài)能力上——這是百度自主研發(fā)的新一代原生多模態(tài)基礎(chǔ)大模型。其在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于OpenAI的GPT4.5,API調(diào)用價(jià)格僅為GPT4.5的1%。
而文心大模型X1則是一款深度思考模型,性能對(duì)標(biāo)DeepSeek-R1,具備“長(zhǎng)思維鏈”,擅長(zhǎng)中文知識(shí)問答、文學(xué)創(chuàng)作、邏輯推理等。值得一提的是,它還增加了多模態(tài)能力和多工具調(diào)用功能,能夠理解和生成圖片,調(diào)用工具生成代碼、圖表等內(nèi)容。而文心大模型X1的API調(diào)用價(jià)格約為DeepSeek-R1的一半,真的是卷瘋了!
此外,文心大模型4.5已上線百度智能云千帆大模型平臺(tái),企業(yè)用戶和開發(fā)者登錄即可調(diào)用API;文心大模型X1也即將在千帆上線。百度搜索、文小言APP等產(chǎn)品,也將陸續(xù)擁抱這兩款新模型。
圖片
這個(gè)動(dòng)作一出,外網(wǎng)也是歡呼一片!
一位網(wǎng)友說“百度,aka中國(guó)的谷歌,開放了兩款新模型”,并評(píng)價(jià)道,“中國(guó)在繼續(xù)構(gòu)建更有成本更低的智能。AI價(jià)格戰(zhàn)正在打響。”
圖片
還有網(wǎng)友制作了視頻,這一波會(huì)讓追隨DeepSeek的用戶倒戈百度!
百度還計(jì)劃于2025年6月30日正式將文心大模型4.5開源,并在下半年發(fā)布文心大模型5.0。看完文心的這兩款新模型,你可能會(huì)對(duì)百度后續(xù)的動(dòng)作充滿期待!
1.文心4.5,一張全能王牌
文心4.5的技能樹點(diǎn)得有多滿呢?
百度官方說,文心4.5“具備更精進(jìn)的語(yǔ)言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。”
多模態(tài)能力
文本能力
我們先來測(cè)測(cè)文心4.5的代碼能力,讓AI幫忙做一個(gè)“少女心爆棚”的貪吃蛇游戲:
“寫一個(gè)貪吃蛇的代碼,選擇可以在網(wǎng)頁(yè)中運(yùn)行的程序,希望是粉紅色戴著蝴蝶結(jié)的貪吃蛇”
看得出文心的代碼習(xí)慣還是不錯(cuò)的
保存到html文件里運(yùn)行了一下,確實(shí)能run,基本的要素都是有的。只不過AI做了一個(gè)小三角形當(dāng)做簡(jiǎn)陋版蝴蝶結(jié),另外就是蛇飛得太快了,不好操作,這點(diǎn)其實(shí)自己改改參數(shù)就能解決了:
然后再來考驗(yàn)下文心4.5的長(zhǎng)項(xiàng)——文本生成。
“幫我寫一個(gè)能讀給成年人聽的睡前故事,希望是溫暖、治愈的,3分鐘內(nèi)可以讀完。”
文心很快就搞定了這個(gè)故事,大家來看看夠不夠治愈呢~
圖片
接下來,我們又小小的開了腦洞,讓文心4.5根據(jù)故事,生成一頁(yè)繪本。
這就是《星星郵遞員與小城老人》的繪本了,其實(shí)我私心希望郵遞員能夠有個(gè)擬人化的形象,這里能看出畫風(fēng)整體還是沒毛病的:
圖片
文心官方介紹說,4.5是智商、情商雙高的模型:“文心大模型4.5也擁有“高情商”,網(wǎng)絡(luò)梗圖、諷刺漫畫等等,理解起來都不在話下。”
我們也測(cè)了一張梗圖,畫手是怎么看待AI的陣營(yíng)九宮格。
圖片
AI是這樣解讀的,可以看出AI在很認(rèn)真地解讀笑點(diǎn),這就讓梗圖的幽默被消解了不少。而且對(duì)于九宮格出現(xiàn)的“椰樹椰汁梗”“九轉(zhuǎn)大腸梗”等等,還不會(huì)進(jìn)行解讀,理解少有些瑕疵,可能無法完美幫助需要理解一張meme的人。
圖片
2.推理模型X1,第一個(gè)有工具箱的推理模型
至于文心X1的亮點(diǎn),一句話就能講清楚“文心大模型X1具備更強(qiáng)的理解、規(guī)劃、反思、進(jìn)化能力,并支持多模態(tài),最重要的,這是首個(gè)自主運(yùn)用工具的深度思考模型。”
根據(jù)百度介紹“作為能自主運(yùn)用工具的大模型,文心大模型X1已支持高級(jí)搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網(wǎng)頁(yè)鏈接讀取、TreeMind樹圖、百度學(xué)術(shù)檢索、商業(yè)信息查詢、加盟信息查詢等多款工具。”
我們先來看看AI調(diào)用繪圖工具的能力吧,最近的315也是帶來了很多重磅炸彈,讓消費(fèi)者直捂胸口。我們希望能AI能生成一張高信息密度的海報(bào),讓我們看一眼就了解今年的315晚會(huì)重點(diǎn)。
“搜集315晚會(huì)打假產(chǎn)品名單,生成一張海報(bào)”。
然后AI就能自主拉起“高級(jí)聯(lián)網(wǎng)”工具,幫我們搜索315相關(guān)的新聞線索。
圖片
在擁有了一份打假名單后,AI又開始使用繪圖工具,給我們繪制海報(bào)了。
圖片
到這一步AI看起來都干的不錯(cuò),只不過,最終的海報(bào)成品是這樣的:
???為啥啊。
圖片
看來,百度的繪畫產(chǎn)品仍然沒能突破“生成漢字”的難關(guān)。
不過,對(duì)于圖表問題,文心X1還是靠譜的,我們用熱搜最新的“用人民幣感受韓國(guó)的工資水平”,讓AI幫我們梳理個(gè)圖表。
圖片
AI會(huì)自己進(jìn)行任務(wù)的拆解:
圖片
然后就能以更直觀的視角“吃瓜”了:
圖片
總體實(shí)驗(yàn)下來,百度的自主工具調(diào)用還沒有完全成熟。在一個(gè)案例測(cè)試中,小編希望能得到一個(gè)樹圖形式的答案,但AI卻堅(jiān)決調(diào)用“代碼解釋器”,并且在幾次嘗試中均沒有coding成功,最后只能給了文本答案。
不過,百度邁出的這一步還是相當(dāng)有意義,相信X1能很快擁有更好用、更匹配的工具,方便AI為我們辦公。
3.寫在最后
百度的加速,反映了國(guó)內(nèi)大模型市場(chǎng)競(jìng)爭(zhēng)的白熱化。免費(fèi)開放文心4.5和X1,不僅是產(chǎn)品迭代的常規(guī)升級(jí),更是面對(duì)行業(yè)競(jìng)爭(zhēng)的一次主動(dòng)出擊。
要知道,此前阿里的推理模型QwQ也在預(yù)覽版里規(guī)劃了各種工具調(diào)用,只不過當(dāng)時(shí)未能上線。這才一晃神的功夫,就被百度的X1偷家了。
這說明,大模型技術(shù)的演進(jìn)已進(jìn)入分毫必爭(zhēng)的階段,這種微弱的領(lǐng)先更讓場(chǎng)上的局勢(shì)波云詭譎。接下來,隨著模型能力的持續(xù)提升,競(jìng)爭(zhēng)將不止于參數(shù)、推理速度和工具集成,如何真正提升用戶體驗(yàn),可能才是決定市場(chǎng)格局的關(guān)鍵。
本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:伊風(fēng)
