成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

Agent planning大揭秘：記憶增強規劃能力！

發布于 2024-8-7 14:37

瀏覽

0收藏

如何讓LLM在規劃能力上變得更聰明，想象一下，如果我們的AI助手能夠記住過去的經歷，并且在需要的時候能夠回憶起來，那會是多么方便的事情啊！

首先，我們要明白，對于AI來說，記憶是提升規劃能力的關鍵。目前，有兩種主要的方法可以通過記憶來增強LLM-Agents的規劃能力：基于RAG的記憶和參數記憶。

Agent planning大揭秘：記憶增強規劃能力！-AI.x社區

RAG，也就是檢索增強生成，它能夠用檢索到的信息來增強LLM的最新知識。想象一下，如果AI能夠把過去的經驗存儲在記憶中，并在需要的時候檢索出來，那會是多么棒的事情！這些記憶通常以文本、表格形式或知識圖譜等形式存儲。例如，有的系統會把每天的人類行為經驗以文本形式存儲起來，然后基于當前情況的相關性和新鮮度來檢索記憶。還有的系統會使用向量編碼模型將每個記憶編碼成向量，并建立索引結構，以便在檢索時快速找到相關信息。下面這些工作都歸屬于這個范疇，后面我們可能會詳細去分享具體內容。

Generative Agents：這項工作存儲了類似于人類的日常經驗，并根據當前情況的相關性和新鮮度來檢索記憶。這些記憶以文本形式存儲，并且可以根據與當前任務的相關性進行檢索。
MemoryBank、TiM 和 RecMind：這些方法將每個記憶編碼成向量，并使用索引結構（如FAISS庫）來組織這些向量。在檢索時，使用當前狀態的描述作為查詢來檢索記憶池中的記憶。這些方法的區別在于它們更新記憶的方式不同。
MemGPT：這項工作借鑒了計算機架構中的多級存儲概念，將LLM的上下文視為RAM，并將額外的存儲結構視為磁盤。LLM可以自主決定是檢索歷史記憶還是將當前上下文保存到存儲中。
REMEMBER：這個方法將歷史記憶以Q值表的形式存儲，每個記錄是一個包含環境、任務、動作和Q值的元組。在檢索時，會同時檢索正面和負面記憶，以便LLM根據環境和任務的相似性生成計劃。

Agent planning大揭秘：記憶增強規劃能力！-AI.x社區

另一方面，參數記憶可以通過微調LLM，將Agent的歷史經驗樣本嵌入到模型參數中。這些經驗樣本通常來自Agent與環境的交互，可能包括關于環境的常識知識、與任務相關的先驗知識，以及成功或失敗的經驗。雖然微調一個大參數的模型成本很高，但通過PEFT，可以通過只訓練一小部分參數來降低成本并加快速度。

Agent planning大揭秘：記憶增強規劃能力！-AI.x社區

但是，這兩種方法都有各自的優勢和局限性。基于RAG的方法提供了實時、低成本的外部記憶更新，主要在自然語言文本中，但依賴于檢索算法的準確性。而微調則通過參數修改提供了更大的記憶容量，但記憶更新成本高，并且在保留細節方面存在挑戰。

最后，我們還需要考慮如何生成記憶。記憶增強的LLM-Agents在規劃中表現出更強的生長潛力和容錯能力，但記憶的生成嚴重依賴于LLM的生成能力。如何通過自生成的記憶來提升較弱的LLM-Agents，仍然是一個值得探索的挑戰領域。

本文轉載自 ??探索AGI??，作者：獼猴桃

標簽

贊

收藏

回復

舉報

回復

相關推薦

簡單卻有效的Agent推理框架：通過預測未來大幅提升智能體的規劃能力

zhangyannni ? 4590瀏覽 ? 0回復
ODA：通過全局觀察增強大模型集成知識圖譜推理能力的新型Agent框架

PaperAgent ? 3578瀏覽 ? 0回復
如何使用HippoRAG增強LLM的記憶

51CTO內容精選 ? 4085瀏覽 ? 0回復
AI Agent的未來在哪里？LangChain CEO探討記憶、工具與自主規劃的完美融合

探索AGI ? 2371瀏覽 ? 0回復
Agent Planning大揭秘：輕松拿捏多計劃選擇！

探索AGI ? 3713瀏覽 ? 0回復
Agent planning終篇：打造更聰明的智能體！

探索AGI ? 3441瀏覽 ? 0回復
LLM+P：賦予大語言模型最佳機器人規劃能力

AIRoobt ? 3234瀏覽 ? 0回復
多模型協作增強模型推理能力

AIRoobt ? 3554瀏覽 ? 0回復
揭秘MemoRAG：AI記憶模塊如何提升生成質量

Syrupup ? 3278瀏覽 ? 0回復
MemLong：用于長文本建模的記憶增強檢索

sbf_2000 ? 2790瀏覽 ? 0回復
被神化的o1模型，規劃能力到底如何？

大語言模型論文跟蹤 ? 3089瀏覽 ? 0回復
草莓OpenAI o1的規劃能力怎么樣？泰斗Subbarao Kambhampati給你答案！

AIGC最前線 ? 2906瀏覽 ? 0回復
Agent memory大揭秘：記憶從哪兒來？

探索AGI ? 3954瀏覽 ? 0回復
o1的規劃能力如何？LRM是未來嗎？

探索AGI ? 2193瀏覽 ? 0回復
大模型是能力強還是記憶強？一項發人深省的研究

芝士AI吃魚 ? 2894瀏覽 ? 0回復
大模型面經：SFT和RL如何影響模型的泛化或記憶能力？

shizhi02 ? 2691瀏覽 ? 0回復
大語言模型：表面的推理能力背后是出色的規劃技巧

51CTO內容精選 ? 2585瀏覽 ? 0回復
使AI Agent具有動態記憶，LangMem快速入門

小虎哦哦 ? 2677瀏覽 ? 0回復
Mem0 讓 AI 擁有超強記憶能力

丟翅膀的魚 ? 4022瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

谷歌又來砸飯碗！免費AI Agent發布，程序員狂喜 7天前發布
AI Agents開源工具棧全解析~ 2025-06-16 00:17:05發布

熱門推薦

AI Agents開源工具棧全解析~ 0回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

效果&成本雙突破！快手提出端到端生成式推薦系統OneRec！ 0回復

上一篇： Agent Planning大揭秘：輕松拿捏多計劃選擇！

下一篇： Agent planning終篇：打造更聰明的智能體！

社區精華內容

目錄

主站蜘蛛池模板：亚洲国产欧美一区 | 国外成人在线视频网站 | 一区二区三区免费 | 日本午夜精品 | 欧美亚洲视频 | 麻豆视频在线免费观看 | 久久一区二区视频 | 精品久久久久久久久亚洲 | 人人看人人射 | 久久久久91| 免费日本视频 | 精品久久精品 | 国产美女久久久 | 中文字幕亚洲精品 | а天堂中文最新一区二区三区 | 国产黄色麻豆视频 | 国产日韩欧美在线 | 东京av男人的天堂 | 久久精品成人 | 在线免费看91 | 亚洲乱码一区二区 | 国内精品久久久久久久影视简单 | 久久亚洲一区二区 | 狠狠操天天操 | 久久新 | 国产人久久人人人人爽 | 国产精品高清在线 | 一级a性色生活片久久毛片午夜精品在线观看 | 久久99精品视频 | 羞羞视频在线网站观看 | 久久国产精品一区二区三区 | 亚洲欧洲日韩 | 欧美在线国产精品 | 狠狠干天天干 | 国产精久久久久久久妇剪断 | 男人天堂免费在线 | jizjizjiz中国护士18 | 91精品国产综合久久婷婷香蕉 | 国产资源网 | 在线中文视频 | 日韩一二区在线观看 |

<rt id="kycoo"></rt>

<center id="kycoo"><tr id="kycoo"></tr></center>

<code id="kycoo"><tr id="kycoo"></tr></code><dl id="kycoo"></dl>

<cite id="kycoo"></cite>

<button id="kycoo"></button>

<code id="kycoo"></code>

<button id="kycoo"></button>