成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

打破思維鏈推理瓶頸!“軟推理”讓大模型學會人類抽象能力,token使用量還更少了

人工智能 新聞
來自SimularAI和微軟DeepSpeed 的研究員聯合提出了Soft Thinking,讓模型在連續的概念空間中進行 “軟推理”,而非局限于離散的語言符號,打破了基于離散token的推理瓶頸。

不再像CoT(“思維鏈”)一樣“一個字一個字往外蹦”,加上“軟思維”就能讓大模型像人類一樣進行抽象思考。

來自SimularAI和微軟DeepSpeed的研究員聯合提出了Soft Thinking,讓模型在連續的概念空間中進行 “軟推理”,而非局限于離散的語言符號,打破了基于離散token的推理瓶頸。

相比標準CoT,Soft Thinking最高提升Pass@1平均準確率2.48%、減少token使用量22.4%。

并且,Soft Thinking是一種即插即用的推理策略,無需額外訓練即可應用于現有模型(如Llama、Qwen)。

圖片

目前主流的語言模型推理方法存在一個關鍵問題:只能逐字生成離散的語言符號(如單詞或子詞)

這就好比思考時只能一個字一個字的蹦出來,不僅限制了模型表達抽象概念的能力,還容易在復雜問題中因“單一路徑選擇”而犯錯。

人類大腦思考時并非依賴明確的語言符號,而是通過抽象概念的靈活整合進行推理。

圖片

Soft Thinking正是受此啟發,將語言模型的推理從“離散符號空間”拓展到“連續概念空間”。

這樣,模型就可以捕捉到介于僅有細微差別的語義之間的概念,能夠更靈活地探索多種解題路徑,同時保持高效和可解釋性。

有網友表示:這種方法解決了自回歸“貪婪”的next token搜索問題。

圖片

如何讓模型像人類一樣進行抽象思考

推理流程:在連續概念空間中 “軟推理”

Soft Thinking僅修改傳統CoT的中間推理階段,保留最終答案的離散生成(如數學題的數字答案或代碼的具體語句)。

Soft Thinking的理論本質是線性近似替代路徑枚舉

解復雜問題時,傳統CoT的推理路徑數量隨步驟呈指數級增長(如每步選1000個token,3步就有1000^3種路徑),無法顯式枚舉。

Soft Thinking通過線性化近似,將指數級路徑求和簡化為概念token的加權計算。

用 概率加權 替代離散采樣,通過連續概念空間中的線性變換,隱式聚合多條路徑的信息,避免顯式枚舉的計算爆炸。

圖片

概念token:用概率分布代替單一符號

傳統方法每次生成一個確定的token(如 “30”“加”),而Soft Thinking生成一個概率分布(如 “30” 的概率40%,“乘以” 的概率30%,“分解” 的概率20%等),這個分布被稱為 “概念token”。

每個概念token相當于多個可能符號的 “混合體”,允許模型同時保留多種推理可能性

如下圖中的例子,在計算“43×34”時,模型可能同時考慮“分解34為30+4”和“直接相乘”兩種路徑的概率,而非只選其一。

圖片

連續概念空間:在 “模糊” 的語義空間中推理

通過將概念token的概率分布與模型的詞向量(Token Embedding)加權結合,形成連續的概念空間。

這里的 “連續” 意味著模型可以在不同概念之間平滑過渡,例如從“分解數字”自然過渡到“乘法運算”,而無需用明確的語言符號分隔步驟。

圖片

Cold Stop機制:避免無效循環

由于模型在訓練中沒見過概念token(屬于 “分布外” 輸入),長時間推理可能導致陷入重復或混亂(類似人類思維的 “卡殼”)。

Soft Thinking引入了一個 “Cold Stop”機制:通過監測概率分布的熵值判斷模型的 “自信程度”。

當熵值持續較低時(表明模型對當前推理路徑很確定),提前終止中間步驟,直接生成答案,避免浪費計算資源。

測試結果及對比

在基準測試里,QwQ - 32B模型的平均Pass@1準確率從標準CoT的83.84%提升至86.32%,最高提升2.48%,其中在AIME 2024數據集上提升6.45%。

推理效率方面,DeepSeek-R1-Distill-Qwen-32B在數學任務中token使用量減少22.4%。

圖片

與其他方法的對比

  • COCONUT-TF(無訓練):直接使用隱藏狀態作為輸入,完全失敗,生成長度達最大值且無正確解。
  • 平均嵌入策略:僅計算top-5 token均值,準確率低且生成長度長(如AIME 2024僅6.66%正確)。

圖片

Soft Thinking通過連續概念空間推理和Cold Stop機制智能平衡了效率與準確性,為大模型優化提供了新思路。

感興趣的朋友可以到官方了解更多細節。

官方網站:https://soft-thinking.github.io/

論文地址:https://arxiv.org/abs/2505.15778

代碼地址:https://github.com/eric-ai-lab/Soft-Thinking

參考鏈接:https://x.com/xwang_lk/status/1925399783503798692

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-29 09:20:00

模型研究推理

2023-06-05 10:01:18

模型測評

2025-02-17 14:43:51

2024-04-11 11:35:03

大語言模型LLMs

2025-02-08 17:00:11

2023-05-15 15:38:59

AI模型

2023-06-05 13:02:19

OlaGPT語言模型

2023-10-11 12:32:53

AI模型

2023-05-05 13:29:04

模型推理

2024-11-11 11:05:00

大語言模型系統

2025-06-13 01:00:00

人工智能大型推理模型推理模型

2025-03-10 11:55:10

2023-06-20 13:38:22

2024-06-24 12:22:34

2025-03-17 08:15:00

AI技術模型

2022-04-11 15:40:34

機器學習研究推理

2025-06-05 11:49:21

AI模型數據

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-06-18 09:06:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品日韩一区二区 | 亚洲免费精品 | 亚洲成av | 久久久人成影片一区二区三区 | 国产精品91久久久久久 | 99久久免费精品国产男女高不卡 | 99精品国产一区二区青青牛奶 | 亚洲大片在线观看 | 久久久久国产一区二区三区四区 | 亚洲欧美精品 | 九九九视频| 精品久久精品 | 日韩三级精品 | av黄色在线 | 亚洲一二三区在线观看 | 日韩中文字幕在线观看 | 日韩成人影院在线观看 | 黄色av网站在线免费观看 | 日韩精品在线播放 | 日日干天天操 | 一区视频| 日本久久www成人免 成人久久久久 | 精品一区二区三区四区五区 | 久久亚洲综合 | 精品一级毛片 | 日韩精品一区二区三区老鸭窝 | 黄色免费网 | 日韩成人在线观看 | 狠狠操在线 | 香蕉视频91 | 毛片一区 | 欧美午夜一区二区三区免费大片 | 一区二区三区视频在线观看 | 亚洲精品区| 久久99精品国产99久久6男男 | 日韩在线三级 | 日日夜夜精品视频 | 欧美成人一区二区 | 国产精品久久久久久久一区探花 | 日本电影一区二区 | 在线播放国产一区二区三区 |