成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI揭示o3的推理過程,以彌合與DeepSeek-R1的差距

譯文 精選
人工智能
OpenAI公司推出o3-mini推理模型,展示了更詳細的思維鏈軌跡,并希望以更透明的方式彌合與顯示其全部思維鏈的DeepSeek-R1的競爭差距。

譯者 | 李睿

審校 | 重樓

生成式人工智能開發商OpenAI公司首席執行官Sam Altman最近在Reddit AMA問答活動中承認,該公司在開源軟件研究方面站在了“歷史錯誤的一邊”。

盡管OpenAI公司尚未發布其開源模型,但已經邁出了提高透明度的第一步。正如該公司在其X帳號上所宣布的那樣,其最新的推理模型o3-mini現在展示了其思維鏈(CoT)跟蹤的更詳細版本。

此前,OpenAI公司的推理模型僅展示了CoT的高級概述,這使得開發人員難以理解模型的推理邏輯并對提示進行相應的調整。

OpenAI公司隱藏了CoT以防止競爭對手利用這一技術來訓練他們自己的模型。但是,在展示所有CoT令牌的DeepSeek-R1模型發布之后,OpenAI在保持其競爭優勢方面面臨著嚴峻挑戰。

OpenAI公司最近進行的更改展示了CoT的更詳細版本,但并沒有揭示原始的推理令牌,這讓OpenAI公司在增強透明度和保護其核心競爭力(如果有的話)之間取得了巧妙的平衡。

以下是展示思維鏈非常重要的原因。在本文作者之前的對比實驗中,發現OpenAI公司的o1模型在處理來自網絡的噪聲數據時略優于DeepSeek-R1。然而,由于o1沒有揭示其思維鏈,因此很難對其錯誤進行故障排除(而且當這兩個模型不是解決簡單問題時,它們都會出現錯誤)。另一方面,DeepSeek-R1的透明度使其成為現實應用中更好的整體模型。

例如,在一個失敗的實驗中,DeepSeek-R1的CoT幫助開發人員發現問題不在于模型本身,而在于獲取數據的檢索組件(這種問題在實際應用中經常發生)。另一方面,o1只給出了一個錯誤的答案和一個模糊的推理鏈。

本文作者對o3-mini進行了一項測試,他向這一模型提供了包含2024年至2025年歷史股票價格數據的文件,并向它提出了需要推理和數據分析的問題(由于ChatGPT o3-mini不支持文件附件上傳,因此只能將內容粘貼到提示中)。這項測試旨在計算每月在Magnificent 7股票上投資140美元的投資組合的價值。該文件包含從雅虎財經獲取的繁雜數據。這些數據包含純文本和HTML元素,其中涵蓋了“Mag 7”股票和非“Mag 7”股票。

測試結果表明,這種新提供的詳盡的CoT極具價值。它可以跟蹤模型推理過程,其中包括哪些股票是“Mag 7”股票,哪些股票在文件中,哪些應該被忽略,以及如何在這些股票之間合理分配投資,以及如何在每個月初準確地獲取每個股票的價值數據等。該模型提供了詳細的答案,不僅詳細闡述了整個推理過程,還明確指出了投資組合的最終價值。

DeepSeek-R1在開放性、價格和透明度方面具有OpenAI公司的推理模型無法比擬的三大優勢。OpenAI通過發布o3-mini在一定程度上縮小了差距。

o3-mini的成本極具競爭力,輸出每百萬令牌僅需4.40美元,遠低于o1的60美元,與此同時,它在多個推理基準測試中的表現還優于o1。相比之下,DeepSeek-R1在美國供應商的運行成本約為每百萬令牌7至8美元。(值得注意的是,雖然DeepSeek在其服務器上運行的R1服務以每百萬令牌2.19美元的優惠價格提供,但許多組織因地域限制而無法使用。)

更改之后的CoT輸出也將幫助OpenAI公司在透明度方面取得顯著進展。但隨著越來越多的云計算服務提供商將其集成到他們的產品中,模型構建者也在此基礎上創建衍生品,DeepSeek-R1正迅速成為推理模型的標準。然而,OpenAI公司是否會改變其保持模型封閉的政策仍有待觀察。

原文標題:OpenAI reveals o3’s reasoning process to bridge gap with DeepSeek-R1,作者:Ben Dickson

責任編輯:姜華 來源: 51CTO內容精選
相關推薦

2025-03-10 08:10:00

AI研究安全

2025-04-22 09:12:00

AI模型數據

2025-02-03 14:17:27

2025-05-29 09:07:37

2025-02-08 09:44:11

DeepSeekAI模型

2025-02-03 14:06:32

2025-05-30 00:00:00

2025-05-30 01:00:00

2024-12-24 16:15:04

2025-02-24 14:05:00

LLM模型AI

2025-02-19 08:00:00

2025-04-29 09:06:00

2025-02-08 11:44:03

2025-02-13 08:51:23

DeepSeek大模型

2025-03-20 10:20:16

2025-02-07 09:05:36

2025-04-23 08:30:05

2025-05-06 09:09:37

2025-02-19 08:33:18

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品三级 | 亚洲一区二区三区在线视频 | 欧美中文字幕一区二区三区亚洲 | 天堂网色 | 精品无码久久久久久久动漫 | 欧美簧片 | 男人阁久久 | 亚洲第一福利网 | 亚洲一区二区免费 | 国产亚洲区 | 精品欧美一区二区三区久久久 | 欧美1区| 国产精品一二区 | 亚洲高清av在线 | 中文字幕在线中文 | 国产免费一级片 | 久久久久久久久国产成人免费 | 能免费看的av | 亚洲高清视频在线观看 | 久久久精品高清 | 国产免费一区二区三区 | 亚洲成人精选 | 一区二区三区精品视频 | 黄色成人亚洲 | www.五月天婷婷 | 欧美网站一区二区 | 中文字幕一区二区三区四区 | 欧美一区二区激情三区 | 超碰97人人人人人蜜桃 | 亚洲国产精品久久久久秋霞不卡 | 91中文视频| 日韩免费一区 | 国产成人精品999在线观看 | 精品一区二区三区四区在线 | 高清人人天天夜夜曰狠狠狠狠 | 亚洲电影免费 | 免费性视频| 国产三级大片 | 国产精品成人一区二区 | 成人在线观看免费视频 | 亚洲成人一级 |