成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微軟研究院MRP:大模型動態(tài)選擇最佳解題策略的元推理提示,比CoT、ToT更有效

發(fā)布于 2024-6-19 13:03
瀏覽
0收藏

大型語言模型(LLMs)在自然語言理解和生成方面表現(xiàn)出色,但面對現(xiàn)實世界問題的多樣性和復(fù)雜性,單一靜態(tài)方法的推理能力有限。現(xiàn)有的推理技術(shù),如思維鏈(Chain-of-Thoughts)、思維樹(Tree-of-Thoughts)等,雖然在特定任務(wù)上有所提升,但未能在不同任務(wù)中持續(xù)實現(xiàn)最佳性能。

人類在認知過程中通過元推理(meta-reasoning)動態(tài)調(diào)整策略,以高效分配認知資源。受此啟發(fā),提出了元推理提示(Meta-Reasoning Prompting, MRP),以賦予LLMs類似的適應(yīng)性推理能力。

元推理提示(Meta-Reasoning Prompting,簡稱MRP)的示意圖,以及與標準推理和傳統(tǒng)推理方法的比較差異。

微軟研究院MRP:大模型動態(tài)選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區(qū)

MRP如何工作?

  • 評估階段:模型先看看有哪些解題方法可用,然后根據(jù)問題的特點,評估哪種方法可能最有效。
  • 選擇階段:模型根據(jù)評估結(jié)果,選擇最合適的解題方法。
  • 應(yīng)用階段:使用選定的方法來解決問題。

微軟研究院MRP:大模型動態(tài)選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區(qū)

通過使用多個廣泛使用的基準測試評估MRP的有效性,結(jié)果表明MRP在不同任務(wù)中的表現(xiàn)達到或接近最佳狀態(tài)。MRP特別擅長需要結(jié)合不同推理策略的任務(wù),在更大的模型如GPT-4中表現(xiàn)尤為出色。

使用GPT4進行的實驗:使用元推理提示(Meta-Reasoning Prompting)與其他獨立方法在基準測試上的性能比較。加粗表示最佳性能,下劃線表示次佳性能。


微軟研究院MRP:大模型動態(tài)選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區(qū)

(a) 不同基準測試上的方法比較顯示,引導(dǎo)大型語言模型(LLM)動態(tài)選擇適當(dāng)?shù)耐评矸椒ǎ乖评硖崾荆∕RP)在所有任務(wù)中持續(xù)實現(xiàn)更好的性能。(b) 將特定推理方法應(yīng)用于所有基準測試的算術(shù)平均和調(diào)和平均性能表明,MRP在總體評估中始終表現(xiàn)卓越。

微軟研究院MRP:大模型動態(tài)選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區(qū)

在GSM8K基準測試上的方法性能

微軟研究院MRP:大模型動態(tài)選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區(qū)

微軟研究院MRP:大模型動態(tài)選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區(qū)

Meta Reasoning for Large Language Models
https://arxiv.org/pdf/2406.11698

本文轉(zhuǎn)載自??PaperAgent??

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 欧美一区二区久久 | 天天影视综合 | 99综合网 | 欧美日韩综合视频 | 国产精品九九九 | 欧美日产国产成人免费图片 | 成人在线观看黄 | 欧美在线一区二区三区 | 91视频一区二区三区 | www.久久精品 | 欧美老妇交乱视频 | 国产精品免费看 | 久久久久久国产精品mv | 日本黄色影片在线观看 | 久久久久久免费免费 | 久久亚洲国产精品 | 日韩电影免费在线观看中文字幕 | 亚洲va欧美va天堂v国产综合 | 久久久久久久久99精品 | 日韩久久久久 | 99久久免费精品视频 | 精品99爱视频在线观看 | 伊人中文字幕 | 国产在线1 | 中文久久| 91av导航| 一区二区视频 | 国产精品区二区三区日本 | 蜜臀久久 | 日韩激情视频一区 | 在线免费观看黄视频 | 日韩精品一区二区三区在线观看 | 91佛爷在线观看 | 中文字幕一页二页 | 国产精品美女视频 | 国产精品美女久久久久久免费 | 精品无码久久久久久久动漫 | 久久久一区二区 | 国产探花在线精品一区二区 | 亚洲精品中文字幕中文字幕 | 国产一二三区电影 |