怕被對手蒸餾，OpenAI只敢公開“閹割版”思維鏈！網(wǎng)友失望：錯誤的摘要還不如沒有！原創(chuàng)

51CTO技術棧

發(fā)布于 2025-2-7 12:26

瀏覽

0收藏

編輯 | 伊風

OpenAI又Open了一點點！

奧特曼預告的o3 "one-more-thing"來了！

怕被對手蒸餾，OpenAI只敢公開“閹割版”思維鏈！網(wǎng)友失望：錯誤的摘要還不如沒有！-AI.x社區(qū) 圖片

OpenAI突然更新了免費和付費用戶的o3-mini思維鏈。在這一更新之后，我們終于能看看模型的推理步驟以及它如何得出答案的過程了！

同時，據(jù) OpenAI 介紹，使用 o3-mini 并選擇“高推理”模式的高級 ChatGPT 訂閱用戶也將看到這一改進后的推理顯示。

OpenAI在推文中還給了一個例子，用戶問ChatGPT“今天為啥不是周五呢？”o3思考了一下，甚至還用了個??的emoji，“我也很驚訝今天不是周五，我猜，當你準備好過周末時時間的流速就變慢了吧”。

怕被對手蒸餾，OpenAI只敢公開“閹割版”思維鏈！網(wǎng)友失望：錯誤的摘要還不如沒有！-AI.x社區(qū) 圖片

OpenAI 發(fā)言人在接受采訪時表示：“我們正在為 o3-mini 引入更新后的 [思維鏈]，讓用戶更容易理解模型的思考方式。通過這次更新，用戶可以更清晰地跟隨模型的推理過程，從而對其回答更有信心。”

看到OpenAI的新動向，評論區(qū)紛紛驚呼：DeepSeek效應無敵了，讓我們一起說謝謝！

怕被對手蒸餾，OpenAI只敢公開“閹割版”思維鏈！網(wǎng)友失望：錯誤的摘要還不如沒有！-AI.x社區(qū) 圖片

但是……也不能高興得太早！網(wǎng)友很快就發(fā)現(xiàn)了其中的蹊蹺——現(xiàn)在o3-mini展示的思維鏈居然是“閹割版”。

OpenAI評論區(qū)第一熱評就是：你給的這是原始思維鏈嗎？

怕被對手蒸餾，OpenAI只敢公開“閹割版”思維鏈！網(wǎng)友失望：錯誤的摘要還不如沒有！-AI.x社區(qū) 圖片

一位網(wǎng)友回復道，我?guī)缀蹩梢钥隙ú皇牵皇潜恍∧Ｐ蛷褪龅恼?CoT。

怕被對手蒸餾，OpenAI只敢公開“閹割版”思維鏈！網(wǎng)友失望：錯誤的摘要還不如沒有！-AI.x社區(qū) 圖片

連奧特曼都直接承認了，現(xiàn)在的 CoT是經(jīng)過“整理”的，更好讀（手動狗頭）。并且也會針對用戶語言進行翻譯。

怕被對手蒸餾，OpenAI只敢公開“閹割版”思維鏈！網(wǎng)友失望：錯誤的摘要還不如沒有！-AI.x社區(qū) 圖片

許多網(wǎng)友表示大失所望。o3-mini "one-more-thing"就是這？不如DeepSeek免費看完整推理。

怕被對手蒸餾，OpenAI只敢公開“閹割版”思維鏈！網(wǎng)友失望：錯誤的摘要還不如沒有！-AI.x社區(qū) 圖片

而且，再做一次摘要其實很容易出bug。

例如這位網(wǎng)友，就看到了疑似o3-mini原始思維鏈以及摘要代碼……真的很尷尬啊！

怕被對手蒸餾，OpenAI只敢公開“閹割版”思維鏈！網(wǎng)友失望：錯誤的摘要還不如沒有！-AI.x社區(qū) 圖片

所以，為啥OpenAI不能大大方方的展示完整思維鏈呢？

1.OpenAI為啥不公開原始思維鏈？

真相只有一個：怕被蒸餾。

在上周的 Reddit AMA（在線問答）中，OpenAI 首席產(chǎn)品官 Kevin Weil 透露說：

“我們正在努力展示比現(xiàn)在更多的內容——[展示模型的思維過程] 很快就會實現(xiàn)。具體方案尚未確定——完整展示思維鏈可能會導致競爭對手進行知識蒸餾（competitive distillation），但我們也知道用戶（至少是高階用戶）希望看到完整的推理過程，所以我們會找到合適的平衡點。”

因此，“摳摳搜搜”的OpenAI找到了一個折中的方案：o3-mini 先進行推理，然后將思維整理成摘要。

OpenAI 發(fā)言人在接受采訪時補充了思維鏈的“整理”細節(jié)：“為了提升清晰度和安全性，我們新增了一個后處理步驟，模型會復查原始思維鏈，移除任何不安全內容，并簡化復雜的概念。此外，該后處理步驟還能讓非英語用戶以其母語獲取思維鏈，使體驗更加友好和易于理解。”

當然，OpenAI的擔心不無道理。優(yōu)質的思維鏈數(shù)據(jù)構造出的數(shù)據(jù)集，使得復刻模型推理能力變得簡單且成本低廉。昨天，我們剛剛報道過李飛飛團隊，利用1000個問題及其答案，記錄了Gemini 2.0 Flash Thinking Experimental的“思考過程”數(shù)據(jù)，以此構建的訓練集對開源小模型進行微調，性能可媲美o1mini。詳見：??不到140塊！李飛飛團隊超低成本復刻DeepSeek R1推理！16張H100只訓練了26分鐘，與R1訓練方法不同！??

問題是，OpenAI很難找到防止蒸餾與保障用戶體驗的“平衡點”，反而會鬧出烏龍。

諷刺的是，此前o3-mini被發(fā)現(xiàn)使用中文做推理。被網(wǎng)友懷疑o3是不是蒸餾過DeepSeek，或使用了部分代碼/數(shù)據(jù)。

怕被對手蒸餾，OpenAI只敢公開“閹割版”思維鏈！網(wǎng)友失望：錯誤的摘要還不如沒有！-AI.x社區(qū) 圖片