成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

強迫模型自我爭論,遞歸思考版CoT熱度飆升!網友:這不就是大多數推理模型的套路嗎?

人工智能 新聞
遞歸思考 + 自我批判,CoRT 能帶來 LLM 推理力的飛躍嗎?

CoT(Chain-of-thought)大家都很熟悉了,通過模仿「人類解題思路」,進而大幅提升語言模型的推理能力。

這幾天,一個名為 CoRT(Chain-of-Recursive-Thoughts)的概念火了!從名稱上來看,它在 CoT 中加入了「遞歸思考」這一步驟。

具體來講,CoRT 能讓 AI 模型遞歸地思考它們的響應,生成替代性方案,并從中選擇最佳的一個。

這就像賦予了 AI 自我質疑或反駁的能力,并一遍一遍地嘗試。

通過將「結構化自我批判」和「遞歸思考模式」結合起來,提升語言模型的推理能力。

圖片編輯助手\SCR-20250512-jzan.jpg

短短兩周時間,CoRT 在 GitHub 的星標數已經快突破 2k 了。

image.png

GitHub 地址:https://github.com/PhialsBasement/Chain-of-Recursive-Thoughts

從技術原理來講,相較于傳統的 CoT,CoRT 讓語言模型不僅能分步驟思考,還能在思考過程中反復回頭檢查、修正,形成類似于人類的「反思性思維」或「內省」的推理路徑。

然而,很多網友對 CoRT 的出現并沒有感到太激動。CoRT 是讓 LLM 更努力思考的不錯技巧,但稱不上什么新穎的 idea。它的工作原理就像一個加入了遞歸組件的元提示(meta-prompt)。

image.png


image.png

還有網友指出,這種方法在 2023 年的論文中《Improving Factuality and Reasoning in Language Models through Multiagent Debate》就出現了。

image.png

有網友發出疑問:CoRT 不就是現在大多數 LLM 的思考模式嗎?

image.png

比如在 Cursor 中配置的 Gemini 2.5 Pro,它的 CoT 就是這樣做的。模型會思考一分鐘,并反駁自己的答案,直到找到最無力反駁的答案。

image.png

再比如,CoRT 不就是 Qwen 和 R1 中的「but wait」模式嗎?模型一直思考,并自我反駁,兩者似乎沒有什么不同。

image.png

大家覺得,CoRT 是不是「新瓶裝舊酒」呢?請在評論區留言。

項目介紹

根據項目介紹,CoRT 的訣竅在于以下四個方面:

  • 自我評估;
  • 有競爭力的替代生成方案;
  • 迭代優化;
  • 動態思維深度。

工作流程包括了以下四個步驟:

首先,AI 生成初始響應。

其次,AI 決定它需要多少輪「思考」。

接著,對于每一輪思考:

  • 生成 3 個替代性響應;
  • 評估所有響應;
  • 選擇最佳響應。

最后,最終響應就是這場 AI 大混戰的幸存者。

Web 界面使用方式(仍處于早期開發階段)

一,打開 start_recthink.bat

二,等待一會,讓它安裝依賴項

三,配置成功

如果你是運行在 linux 系統上,則依如下:

image.png

打開一個新的殼層(shell):

image.png

效果怎么樣呢?

作者使用 Mistral 3.1 24B 進行了測試,根據他的說法,CoRT 在編程任務中的表現從「meh」(一般般)升到了「holy crap」(碉堡了)。

我們來看一下示例,下圖為 Mistral 3.1 24B+CoRT:

image.png

下圖為 Mistral 3.1 24B 無 CoRT:

image.png

從結果來看,使用 CoRT 前后,Tic-tac-toe(井字棋)游戲從基礎的 CLI(命令行界面)變成了完全的 OOP(面向對象編程)。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-05-28 02:40:00

AdaptThink推理模型AI

2020-12-14 08:02:52

碼德代碼產品

2019-03-10 16:18:09

Facebook馬克·扎克伯微信

2025-03-05 00:22:00

2014-12-23 11:10:47

紅星LinuxLinux

2025-01-15 13:01:07

2025-05-30 02:00:00

獎勵模型RRMAI

2019-05-09 09:34:34

API暴力破解安全

2009-07-14 15:39:34

Swing大多數控件

2022-02-22 10:53:14

Firefox火狐瀏覽器瀏覽器

2022-07-20 06:55:10

TCC分布式事務微服務

2022-03-10 10:06:57

數據治理美團體系化建模

2011-05-26 10:50:31

2025-01-27 12:03:11

2014-01-02 10:34:54

設計設計師

2024-07-04 15:47:28

2025-06-10 03:30:00

2019-05-27 09:14:28

2025-05-13 05:11:00

推理模型微調

2024-09-24 11:01:03

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 女人毛片a毛片久久人人 | 国产精品乱码一区二三区小蝌蚪 | 日韩免费视频一区二区 | 性国产丰满麻豆videosex | 国产精品久久久久久久久久久久 | 成人 在线| 亚洲高清免费观看 | 国产精品久久久久久中文字 | 最新国产精品精品视频 | 久久av网 | 国产在线不卡 | 久草色视频| 天天操天天射天天 | 五月激情综合 | 一区视频 | 三a毛片 | 日韩欧美在线精品 | 免费观看黄色一级片 | 国产欧美一区二区三区久久手机版 | 欧美亚洲国语精品一区二区 | 一本色道精品久久一区二区三区 | 国产福利在线 | 亚洲精品乱码久久久久v最新版 | a级毛片国产 | 观看av| 成人欧美一区二区三区黑人孕妇 | 91国在线观看 | 福利社午夜影院 | 国产精品成人一区二区三区 | 一区二区视频免费观看 | 国产欧美精品一区二区三区 | 亚洲精品二区 | 一级特黄网站 | 欧美激情一区二区三级高清视频 | 91麻豆精品国产91久久久久久 | av一级毛片 | 在线观看视频福利 | 一级黄色片一级黄色片 | 玖玖视频 | 久久精品亚洲精品国产欧美 | 亚洲图片视频一区 |