成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI o3-mini 干翻了 DeepSeek R1?

發(fā)布于 2025-2-3 22:13
瀏覽
0收藏

整個過年期間,AI 圈的頭條都被被 DeepSeek 霸占了。2 月 1 日,OpenAI 終于按捺不住,推出了全新的推理模型系列 o3-mini。這個系列不僅首次對免費用戶開放了推理模型,還將成本降低了多達 15 倍(相比之前的 o1 系列)。

OpenAI 還表示,這是其推理模型系列中最新且最具成本效益的模型:

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

最近,AI 社區(qū)非常熱衷于將 DeepSeek R1 與其他推理模型進行對比。

尤其是經(jīng)典的編程挑戰(zhàn)——模擬彈跳球:“Write a Python script that makes a ball bounce within a certain shape. Let the shape rotate slowly and ensure the ball stays within the shape.”(編寫一個Python腳本,使一個球在某個形狀內(nèi)彈跳。讓這個形狀緩慢旋轉(zhuǎn),并確保球保持在形狀內(nèi)。)

這個,相當于一個碰撞檢測算法,需要模型識別何時兩個物體(例如球和形狀的邊緣)發(fā)生碰撞。寫得不好的算法可能會導致明顯的物理錯誤。

隨著 DeepSeek R1 在國外持續(xù)發(fā)酵,微軟、NVIDIA、亞馬遜等美國云計算平臺紛紛爭相采用 R1,而 R1 在這一任務上也壓倒了 OpenAI 的 o1-pro。

從 Claude 3.5 Sonnet 和谷歌 Gemini 1.5 Pro 生成的結(jié)果來看,DeepSeek 旗下的開源模型確實在性能上領(lǐng)先了一個層次以上。

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

然而,隨著 o3-mini 的發(fā)布,輿論似乎一夜之間發(fā)生了變化,因為一篇文章宣稱 OpenAI 的 o3-mini 已經(jīng)超越了 DeepSeek R1。目前,這篇文章已吸引了近 400 萬網(wǎng)友的關(guān)注。

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

開發(fā)者使用的提示是:“write a Python program that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically.”(編寫一個Python程序,展示一個球在旋轉(zhuǎn)的六邊形內(nèi)彈跳。球應受重力和摩擦力的影響,并且必須真實地從旋轉(zhuǎn)的墻壁反彈。)

這意味著 o3-mini 和 DeepSeek R1 都被要求編寫一個 Python 程序,使得球在旋轉(zhuǎn)的六邊形內(nèi)彈跳,且小球在彈跳過程中需要受到重力和摩擦力的影響。最終的結(jié)果如下:

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

在結(jié)果方面,o3-mini 展現(xiàn)了更好的碰撞和彈跳效果。從重力和摩擦力的理解上看,DeepSeek R1 版本中的小球似乎與牛頓定律相悖,完全忽略了重力。

這并非個別情況。hyperbolic_labs 的聯(lián)合創(chuàng)始人金宇晨(Yuchen Jin)曾經(jīng)指出過這個問題。他將提示“write a python script of a ball bouncing inside a tesseract”(編寫一個Python腳本,模擬一個球在四維超立方體內(nèi)部彈跳)輸入到 DeepSeek R1 和o3-mini 中。

四維超立方體的每個頂點相鄰四條邊,每條邊連接兩個立方體。四維空間中的幾何形狀超出了人類的直觀感知,因此當我們聽到這些描述時,可能很難想象四維超立方體的樣子。

o3-mini 不僅展示了一個穩(wěn)定的幾何結(jié)構(gòu),而且小球在四維空間內(nèi)彈跳的軌跡也非常靈活,給人一種撞擊立方體側(cè)面的沖擊感。

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

根據(jù)金宇晨的說法,他嘗試了多次,每次使用 DeepSeek R1 的結(jié)果都不如 o3-mini 的一次嘗試。例如,這次嘗試的結(jié)果只是留下了一個靜止的小球。

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

在 Pass@1 測試中,這次 DeepSeek R1 展示了小球和幾何框架,甚至小球的顏色也發(fā)生了變化。不幸的是,它將四維超立方體簡化為三維空間坐標。

? OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū) 圖片 ?

本文轉(zhuǎn)載自 ??PyTorch研習社??,作者: 南七無名式

收藏
回復
舉報
回復
相關(guān)推薦
主站蜘蛛池模板: 免费在线h视频 | 一区视频在线 | 四虎影院新地址 | 欧洲一区二区三区 | 成人精品在线视频 | 一区二区三区四区不卡视频 | 成年人在线视频 | 亚洲综合无码一区二区 | 一区二区三区在线免费观看视频 | 日韩av看片 | 国产免费让你躁在线视频 | 国产黄色大片在线观看 | 欧洲一区在线观看 | 欧美久久国产精品 | 不卡一区| 日本人做爰大片免费观看一老师 | 久久久久9999 | 国产精品久久久久久婷婷天堂 | 成人福利网站 | 亚洲视频在线免费观看 | 免费看国产一级特黄aaaa大片 | 9999国产精品欧美久久久久久 | 国产精品视频一区二区三区 | 少妇午夜一级艳片欧美精品 | 成人在线视频观看 | 精品亚洲一区二区三区 | 欧美日韩中文字幕在线播放 | 亚洲一区在线观看视频 | 亚洲精品小视频在线观看 | 你懂的免费在线 | 欧美日韩在线免费 | 日韩国产在线 | 国产精品美女久久久久aⅴ国产馆 | www久久久 | 狠狠干天天干 | 欧美久久一区二区 | 国产精品久久 | 久久久精品视频免费看 | 日韩国产免费观看 | 欧美日韩综合 | 亚洲国产一区二区视频 |