谷歌突發(fā)大招刷爆AI編程榜!網(wǎng)友:不用買Cursor了
因為大家太過熱情, Gemini 2.5提前重磅更新——
史上最強編碼模型Gemini 2.5 Pro Preview的I/O版。
只需一張手繪的草圖,就可以構(gòu)建一個「繪圖變音頻」的網(wǎng)頁版應(yīng)用。
其他游戲、對象模擬等等也都可以通過一句提示完全搞定。
圖片
它在所有LMArena排行榜上均超越Claude位列第一,包括所有文本領(lǐng)域、視覺以及WebDev Arena排行榜。
為此,這也是有史以來單一模型首次橫掃文本、視覺和WebDev領(lǐng)域!
圖片
網(wǎng)友們表示,好家伙,不用買Cursor了。
圖片
代碼能力屠榜
此次更新的重點就在于編碼能力,包括不限于改進前端和UI開發(fā),以及基礎(chǔ)編碼任務(wù)(例如代碼轉(zhuǎn)換和編輯,以及創(chuàng)建復(fù)雜的代理工作流)。
以前端web開發(fā)來說,它目前在WebDev Arena排行榜上位列第一。這個排行榜專門用來衡量人類對模型構(gòu)建美觀且功能強大的Web應(yīng)用能力的偏好。
與之前版本相比,相當(dāng)于上漲了147分。Demis Hassabis表示:no big deal。(doge)
圖片
目前像Cursor背后公司、Cognition和Replit等都使用了該模型。
具體來看看各種實際場景中的應(yīng)用。
- 視頻轉(zhuǎn)代碼
圖片
基于模型的視頻理解能力,它可以從單個 YouTube 視頻創(chuàng)建交互式學(xué)習(xí)應(yīng)用。
就像這樣~跟之前模型版本相比,用戶界面也更加完善。
圖片
它在VideoMME 上獲得了84.8% 的得分。
- 新功能開發(fā)
圖片
實現(xiàn)新功能意味著需要手動深入設(shè)計文件,檢查組件以匹配顏色、字體、內(nèi)邊距、外邊距和邊框等樣式屬性,然后手動編寫所需的 CSS 代碼來準(zhǔn)確復(fù)制這些視覺屬性。
但現(xiàn)在只需一句提示詞,就可以復(fù)刻風(fēng)格,比如添加一個windows 95風(fēng)格的視頻播放器。
除此之外,它還增加了一些新功能,比如聽寫入門應(yīng)用,只需說出你的想法,Gemini就能將創(chuàng)意變?yōu)楝F(xiàn)實。
目前,開發(fā)者可以通過Google AI Studio和Vertex AI在 Gemini API 中使用更新的 Gemini 2.5 Pro 開始構(gòu)建。Gemini App的用戶也可以使用它。
Gemini取代Gemini
在官方博客中,他們還表示:這個版本原計劃在幾周后的Google I/O大會上發(fā)布,但由于Gemini 2.5太受歡迎,于是決定現(xiàn)在發(fā)。
這是基于 Gemini 2.5 Pro編碼和多模態(tài)推理功能所獲得的廣泛好評而做出的改進。
有一說一,Gemini 2.5這一系列確實受到不少關(guān)注。
就在前幾天,Gemini 2.5 Pro在直播中通關(guān)了《寶可夢藍》,成為首個大模型寶可夢聯(lián)盟冠軍,直接打破了此前Claude的記錄。
圖片
此次新版本一出,有網(wǎng)友給出了高度評價:Gemini取代Gemini是一個信號,表明有些事情已經(jīng)發(fā)生了變化。
谷歌在各個方面都在穩(wěn)步發(fā)展。頭把交椅仍會易主,但巨龍已經(jīng)蘇醒了。
圖片
那么,問題來了,既然模型新版本這么強大,為啥谷歌不更新版本號呢?(手動狗頭)
圖片
參考鏈接:
[1]https://x.com/GoogleDeepMind/status/1919770265711419826
[2]https://x.com/lmarena_ai/status/1919774743038984449
[3]https://x.com/AndrewCurran_/status/1919813547212865770
[4]https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/