一文徹底理解大模型 Agent 智能體原理和案例 原創 精華
1、什么是大模型 Agent ?
大模型 Agent,作為一種人工智能體,是具備環境感知能力、自主理解、決策制定及執行行動能力的智能實體。簡而言之,它是構建于大模型之上的計算機程序,能夠模擬獨立思考過程,靈活調用各類工具,逐步達成預設目標的智能存在。
Agent 是 AI 大模型應用的主要新形態,在技術架構范式也發生了很大的變化,從面向過程的架構變成了面向目標架構。
2、Agent 架構設計剖析
大模型雖作為智能體的核心“大腦”,負責思維與決策,但僅憑此并不足以勝任復雜任務的執行。為了全面實現智能體的功能,還需融入類似“神經感官系統”以感知環境,以及“肢體”以執行實際動作的元素。這正是構建 Agent 技術架構的初衷,旨在通過這一框架,將感知、思考與行動三者緊密結合,共同作用于復雜任務的完成。
如上圖所示,Agent 共由4個關鍵部分組成:規劃(Planning)、記憶(Memory)、工具(Tools)、行動(Action),下面詳細剖析。
1、規劃(Planning)
"規劃"是智能體的思維模型。類比人類,面對任務,我們先構思解決方案,拆解為子任務,評估工具,執行中反思調整,并考量終止時機。通過大模型提示工程,比如:ReAct、CoT 推理模式,可賦予智能體類似思維模式,精準拆解復雜任務,分步解決。
2、記憶(Memory)
記憶,即信息存儲與回憶。智能體模擬人類,設短期記憶存會話上下文,助多輪對話,任務畢則清;長期記憶存用戶特征、業務數據,向量數據庫速存速查。
3、工具(Tools)
智能體依據“工具”感知環境、執行決策。工具比如:神經感官,助其獲取信息、執行任務。配備多樣工具并賦權,比如:API 調用業務信息,插件擴展大模型能力,比如:ChatPDF 解析文檔、Midjourey 文生圖。
4、行動(Action)
智能體依規劃與記憶,執行具體行動,包括與外部互動或工具調用,實現輸入至輸出的轉化。比如:智能客服回復、查詢天氣預報、AI 機器人抓起物體等等。
3、大模型 Agent 案例
案例一:Agent 預定餐廳
為了更好地理解 大模型 Agent,我們一起來看個生活中的實際場景:假設你需要與朋友在附近吃飯,需要 Agent 幫你預訂餐廳。
Agent 會先對您提出的任務進行規劃如下:
第一步:獲取當前位置
- 推理 1:當前知識不足以回答這個問題,需要知道當前所在位置以及附近的餐廳;
- 行動 1:使用地圖工具(Tools)獲取當前所在位置;
- 結果 1:得出附近餐廳列表。
第二步:確定匹配餐廳
- 推理 2:確定預訂的餐廳,需要知道飲食偏好以及其他細節(比如:吃飯時間、人數);
- 行動 2:從記憶(Memory)中獲取您的飲食偏好、人數、時間等信息;
- 結果 2:確定最匹配的餐廳。
第三步:預訂餐廳
- 推理 3:基于結果2,評估當前所擁有的工具能否完成餐廳預訂;
- 行動 3:使用相關插件工具,進行餐廳預訂(Aciton);
- 結果 3:任務完成。
案例二:完成工作報表 Agent
構建【工作報告智能體】整體步驟如下:
第一步:規劃(Planning):設計 Prompt 引導大模型拆解“生成工作報告”任務,細化為四步:數據收集、報告整理、匯報人選定、自動提交。
第二步:工具(Tools):針對大模型知識局限,采用 RAG 技術接入私有數據中心 API,獲取客戶數據;同時接入工作報告應用 API,賦予數據填充與提交權限。
第三步:記憶(Memory):分析員工歷史報告,提煉風格、格式、周期、匯報人等特征,形成長記憶庫,輔助新報告撰寫。
第四步:行動(Action):依托工作報告應用權限,大模型完成報告后自動執行提交,實現全程自動化。
本文轉載自公眾號玄姐聊AGI 作者:玄姐
原文鏈接:????https://mp.weixin.qq.com/s/HgLYiIrwIka1dfi35pArDA??
