從openAI最新模型GPT-o1再談思維鏈(Cot)技術，大模型該怎么提升其邏輯推理能力？原創

AI探索時代

發布于 2024-9-18 10:57

瀏覽

0收藏

“ 推理能力是大模型邁向AGI的必經之路 ”

最近openAI發布了號稱史上最強模型——o1，其具有強大的邏輯推理能力，號稱能達到人類的博士生水平。

而從o1模型的評測來看，o1模型在數學競賽，編碼，科學問答等方面表現良好，甚至高出了GPT4o一大截。

而且，o1在物理，化學，生物，邏輯學等其它領域，相比GPT4o都得到了巨大的提升。

而據介紹o1模型之所以具有如此強大的邏輯推理能力，就是因為使用了思維鏈技術；當然，目前官方并沒有公布o1的核心技術理論，因此也不排除o1模型使用了其它更加強大的邏輯推理技術。

大模型之思維鏈技術

在前面的文章中也簡單介紹過大模型的思維鏈技術——大模型推理引擎之思維鏈技術，里面介紹了思維鏈的基本邏輯以及其實現原理。

簡單來說，思維鏈技術就是模擬人類的思維方式，在面對復雜問題時，讓大模型像人類一樣思考，把復雜問題拆分成簡單的步驟，然后通過調用工具一步一步地去完成。

而大模型還有哪些能夠提升其邏輯推理能力的技術或方法？今天就來盤點一下提升大模型邏輯推理的黑科技。

初級推理技術

大模型初級推理技術的核心是，把大型復雜的任務，分解成一個一個的簡單的小任務。

主要包括，思維鏈(CoT)，自洽性思維鏈(CoT-SC)，思維樹(TOT-tree of thought)等技術。

思維鏈

思維鏈全稱Chain of Thought，就是把任務進行拆解，適用于各種推理任務，比如數學，邏輯判斷等，思維鏈的優點就是不用對模型進行訓練和微調。

在思維鏈技術中，可能還會使用到零樣本(zero-shot prompt)提示和少樣本提示(few-shot prompt)等技術。

從openAI最新模型GPT-o1再談思維鏈(Cot)技術，大模型該怎么提升其邏輯推理能力？-AI.x社區

自洽性思維鏈

所謂的自洽性思維鏈，是指對同一個問題，生成多個不同的思維鏈技術，并讓模型從中挑出最合適的方案。

思維鏈技術并不穩定，其效果取決于大模型的能力，而如果讓大模型進行發散性思維，通過多種不同的方式解決問題，然后從中找到最優解，這就是自洽性思維鏈。

思維樹

思維樹(TOT)是對思維鏈(CoT)的進一步擴展，在思維鏈的每一步，推理出多個分支，拓撲展開成一棵思維樹。使用啟發式的方法評估每個推理分支對問題解決的貢獻。

使用搜索算法，如廣度搜索或深度搜索算法等來探索思維樹，并進行前瞻和回溯。

中級推理技術

初級推理技術的優點是簡單，缺點是結果不可控，推理過程與結果完全由大模型本身自由發揮，即使出錯也沒有糾錯機制。

因此，以ReAct，Plan & Execute和Self Discover為代表的中級推理技術就出現了。

其會約束大模型的推理方向，并根據環境反饋進行糾錯。

ReAct

ReAct全稱Reasoning and Acting，意思就是推理與行動，來解決多樣化的語言推理與決策任務。

其典型的流程是Thought-思考——Action-行動和Observation-觀察；思考與行動都比較容易理解，觀察其實就是一個反饋的過程，把任務執行的步驟記錄下來進行觀察，根據觀察結果進行調整。

這樣經過思考——行動——觀察——再思考——再行動——再觀察的過程，經過多次循環，最終達到目的。

從openAI最新模型GPT-o1再談思維鏈(Cot)技術，大模型該怎么提升其邏輯推理能力？-AI.x社區

Plan & Execute

Plan & Execute 方法的本質是先計劃再執行，從名稱就可以看出，計劃 & 執行，通過把問題拆分成一個一個的子任務，根據情況調整執行計劃。

Self-Discover

Self-Discover主要包含兩個階段：

階段一：自發現特定任務的推理結構

階段二：應用推理結構

高級推理技術——Reflexion 和 LATS

初級推理和高級推理雖然能解決一些簡單的任務，但對一些更復雜，思維鏈路更長的任務就束手無策了。

因此，高級推理技術就出現了，Reflexion和LATS的核心思想就是通過強化學習的方式來解決更復雜的任務場景。

Reflexion

Reflexion 的本質是強化學習，它主要由三部分組成，參與者——Actor，評估者——Evaluator和自我反思——Self-Reflection。

Reflexion 旨在通過反思過去的錯誤，并把這些知識納入未來的決策，用以幫助Agent提升表現能力。因此，Reflexion非常適合那種通過反復實驗得到結果的任務，比如決策，推理，編程等。

從openAI最新模型GPT-o1再談思維鏈(Cot)技術，大模型該怎么提升其邏輯推理能力？-AI.x社區

LATS——Language Agent Tree Search

LATS技術全稱是——Language Agent Tree Search，簡單來說就是Tree search + ReAct + Plan&Execute+ Reflexion，因此可以說LATS技術是目前最強的推理技術，集百家之長。

這里的ReAct，Plan & Execute 和Reflexion在前面的內容中都簡單介紹過，這里要再介紹一下Tree Search。

Tree Search是一種樹搜索算法，LATS使用蒙特卡羅算法(MCTS)，通過平衡搜索找到最優決策路徑。

總之，大模型的推理能力是邁向AGI的基礎，也是Agent未來應用的基石。

本文轉載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/_8IQuXHPD1pjG1aaNh9q6w???

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

大模型

思維鏈

已于2024-9-18 11:01:08修改

贊

回復

舉報

回復

相關推薦

探究代碼思維鏈對大模型推理能力的作用

mb5f8eba9bdb0af ? 4592瀏覽 ? 0回復
OpenAI模型終于更新！強大視聽能力的GPT-4o將面向所有用戶，其前身正是神秘的gpt2！

51CTO技術棧 ? 3551瀏覽 ? 0回復
ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了

輕薄滴假象 ? 3937瀏覽 ? 0回復
思維鏈緩存-Buffer of Thoughts，北大、UC伯克利、斯坦福最新研究大幅提升LLM推理

angel ? 4991瀏覽 ? 0回復
大模型思維鏈推理的綜述：進展、前沿和未來

AIRoobt ? 6782瀏覽 ? 0回復
自我一致性提升大模型中的思維鏈推理能力

AIRoobt ? 5949瀏覽 ? 0回復
大語言模型自動思維鏈提示

AIRoobt ? 3131瀏覽 ? 0回復
大模型時代信息抽取任務該何去何從？復旦發布InstructUIE提升大模型信息抽取能力

arnoldzhw ? 4965瀏覽 ? 0回復
剛剛，OpenAI發布史上最強模型-o1，推理能力超人類博士！

Aceryt ? 2848瀏覽 ? 0回復
OpenAI o1模型推理能力大幅提升的背后：重復采樣如何提升AI推理能力

Syrupup ? 3923瀏覽 ? 0回復
OpenAI o1引發的思維鏈思考：思維鏈提示啟發大模型推理

angel ? 4029瀏覽 ? 0回復
OpenAI o1推理模型基礎入門

51CTO內容精選 ? 2570瀏覽 ? 0回復
OpenAI o1：用內部思維鏈進行復雜推理

shizhi02 ? 2838瀏覽 ? 0回復
LLaVA-o1：第一個能夠進行自發、系統推理的視覺語言模型，類似于 GPT-o1

Halo咯咯 ? 2799瀏覽 ? 0回復
LLM合集：港大利用GPT-4o生成QA對，打造大規模多模態視頻思維鏈（COT）數據集

AIPaperDaily ? 3230瀏覽 ? 0回復
挑戰LLM邏輯推理極限！新基準TEXTGAMES能否揭開大模型的短板？

sbf_2000 ? 1924瀏覽 ? 0回復
【一文了解】大模型的思維鏈技術（CoT）

碼農隨心筆記 ? 2081瀏覽 ? 0回復
思維鏈(COT)+反思(Reflection)+語言強化(Verbal R)能否提升大模型推理能力到ChatGPT O1的水平？

后向傳播 ? 652瀏覽 ? 0回復
微軟重磅發布三大AI推理算法：突破大模型數學與邏輯推理瓶頸

柏企閱文 ? 873瀏覽 ? 0回復

AI探索時代

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂