成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

殺瘋了!Gemini 2.5狂飆「高爾頓板」測試,編碼橫掃所有OpenAI模型

人工智能 新聞
谷歌的AI編碼能力正在掀起一場風暴!在高爾頓板 測試中,Gemini 2.5 Flash以驚艷表現擊敗OpenAI多款模型,連谷歌首席科學家Jeff Dean 都為其點贊。谷歌新模型「dayhush」已在網頁開發領域嶄露頭角,性能超越Gemini 2.5 Pro,被網友稱為「AI編碼的地震性突破」。

編碼能力一直是頂尖模型宣傳的重點。

尤其是,AI大神Karpathy帶火vibe coding(氛圍編程)概念后,普通人也可以通過AI體驗到編程的樂趣。

游戲、網頁、3D建模,再加上最近爆火的MCP協議,大家玩得不亦樂乎。

不只是娛樂,很多AI專家、公司CEO、行業分析師甚至認為,AI可能會在2-3年內取代絕大部分的程序員。

AI編程真的有那么強嗎?哪家的效果更好?

就在最近,網友RameshR通過高爾頓板(Galton board)測試,對比了Gemini 2.5 Flash、GPT-4o mini、o4-mini-high及o3等幾個最新的模型。

結果他發現,Gemini 2.5 Flash在這項高爾頓板測試中表現炸裂,而OpenAI的幾個模型則完全不行,沒能搞定這個任務。

圖片

RameshR表示,Gemini 2.5 Flash幾乎瞬間就能get到意圖,生成的代碼簡潔又漂亮。

在Gemini 2.5 Flash上,他一共提示5次就搞定了。而在OpenAI的模型上,RameshR則折騰了半小時都沒有完成,最后直接選擇放棄。

可以看出,Gemini 2.5 Flash生成的動畫中,整個高爾頓板的排布都沒有明顯的問題,小球的運動、碰撞也基本符合物理規律。

當然,最后小球的排列也是遵循正態分布。

圖片

RameshR的高爾頓板測試帖子發出后立即點燃了網友們的興致,就連谷歌的首席科學家Jeff Dean也出來給他點贊。

當然,也是為了給Gemini 2.5 Flash站臺。

圖片

資深工程師Ray Fernando使用相同的提示詞在o4-mini-high上進行了測試,結果表現還是不太完美。

他不得不又在GPT-4.1上重新試了一次,表現還是差強人意。

圖片下邊柱子和固定的小球已經重合到一起了,小球的排列也不符合正態分布的規律。

圖片

還有網友使用其他的模型做了測試,比如Alex Kotenko就使用了Claude 3.7。

他表示在使用了相同的初始提示和一次后續調整就完成了測試。只不過從結果來看,小球的排列并不怎么符合正態分布。

圖片

而Isaac Naor則使用Gork模型一次就完成了測試。

圖片

可以看出Gork模型生成的動畫在界面和小球的運動上表現還可以。

但小球最后的排列并不太符合正態分布規律,距離Gemini 2.5 Flash還有差距。

谷歌正勢如破竹

這還只是Gemini 2.5 Flash的表現,Gemini 2.5 Pro的效果只會更好。

谷歌DeepMind正勢如破竹!在第七代TPU Ironwood的加持下,Gemini模型不僅性能很強,性價比也格外的高。

谷歌似乎是找到了最佳編碼模型的秘密。

剛剛,網友AshutoshShrivastava發帖稱,谷歌又又又推出了一個新模型「dayhush」,已在網頁開發領域上線。

更加夸張的是,這個新模型似乎比Gemini 2.5 Pro更出色。他還提供了新模型的一些更詳細信息。

圖片

圖片

測試過「dayhush」的網友Taro Bushidō表示,「這將是對AI編碼的一次地震性轉變。」

圖片

網友MuffinV也認為,Dayhush是一個大的飛躍。

它的思考時間更長,效果也最好,而且目前沒有任何其他模型能達到這種水平。

圖片

他使用Dayhush模型創建了一些知名網站,效果非常棒。

「沒有任何模型能夠如此精確地創建youtube和spotify的用戶界面。」他說。

圖片圖片圖片圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-03-26 06:56:56

2025-06-17 08:40:44

2025-05-21 09:15:00

2024-05-20 08:28:10

2025-06-23 00:00:01

2025-05-07 10:01:35

2023-03-27 13:42:22

2023-12-07 11:48:00

2025-06-11 08:56:54

2025-04-10 10:44:00

2023-08-01 07:45:52

2025-05-07 10:09:08

2025-04-10 10:41:36

2025-06-13 11:25:04

大模型LLMAI 技術

2025-05-21 06:58:03

2025-03-14 12:14:38

2025-04-10 06:16:33

2025-05-15 08:35:00

2021-05-13 09:29:03

FragAttacks漏洞WiFi設備

2025-05-07 09:14:26

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 天天干天天爽 | 国产视频2021 | 国产欧美精品一区二区三区 | 日韩国产三区 | 日韩二三区 | 亚洲精品自在在线观看 | 欧美精品一二三 | 亚洲欧美激情四射 | 久久久片 | 99精品欧美 | 欧美日韩亚洲二区 | 免费午夜电影 | 日韩中文字幕在线观看 | 国产美女在线看 | 四虎最新视频 | a成人| www.99热.com | 久久久久亚洲精品 | 在线观看欧美日韩视频 | 久久91av| 人人看人人草 | 久久国产一区 | 久久久久国产 | 精品久久久久久久久久久久 | 日韩在线免费视频 | 亚洲 中文 欧美 日韩 在线观看 | 免费在线精品视频 | 日韩a级片| 成人免费视频 | 一区二区三区免费在线观看 | 国产精品久久久久国产a级 欧美日韩国产免费 | 欧美一区二区三区在线观看视频 | 亚洲福利网 | 久久久久www | 好好的日在线视频 | 自拍第1页 | 日韩视频一级 | 成人不卡| www.4hu影院 | 风间由美一区二区三区在线观看 | 成人小视频在线观看 |