智能體(Agent)的三種表現類型:聊天助手、工作流與對話流 原創
智能體主要由大語言模型(LLM)+ 提示詞(Prompt)+知識庫(RAG)+工作流(WorkFlow)+工具(Tools)等若干元素組成。
今天我們開啟《人人都會做智能體》公開課第 2 節:智能體(Agent)的 3種表現類型——聊天助手類型、工作流類型、對話流類型。
「本文配圖主要來源于我的長篇圖文寫作助手」
??讓DeepSeek聊天記錄秒變長篇圖文和PPT的智能體,Claude3.7手把手喂飯教程!??
與智能體的組成不同,所謂的智能體表現模式,就是智能體呈現給大家的樣子或者交互方式。智能體開發平臺Dify里面,將智能體的類型分成了5種,但是我覺得這種分法很容易讓初學者產生誤解。
上圖種的Agent竟然是應用類型,Agent不是智能體的英文名稱嗎?下圖種工作流的節點也叫Agent??
Dify的插件分類中也有Agent?另外Dify中的工具和插件的區別是什么?
所以說,Dify產品雖然非常優秀,但是在我這種喜歡扣字眼的產品經理眼里,Dify對產品的功能組件的定義顯得太過隨意,大部分人只是時間長了,用習慣了,自然而然的接受了,但是對于初學智能體開發的人來說,理解這些功能將會非常痛苦。
經過對各種智能體的分析總結,智能體其實主要分為這么三類,下面給大家詳細介紹一下。
(1)聊天助手類型
這種是最常見的智能體形態,騰訊混元、通義千問、DeepSeek 的網頁聊天窗口其實就是智能體,也是普通用戶使用大模型使用的入口,越來越多的功能掛載到這個入口,這個網頁聊天窗口已經從最簡單的聊天對話助手,變成了一個整合多模態能力的超級智能體。
聊天助手類型的主要有以下特點:
在Dify種,聊天助手類型的智能體,開發界面一般是這樣的,如果這個智能體需要在對話時調用外部工具,則只需將工具添加進來就可以了。
(2)工作流類型
工作流類型的智能體更加復雜和強大,它允許用戶設計一系列預定義的步驟,讓智能體按照這些步驟自動執行任務。
工作流型Agent具備執行復雜任務的能力,通過集成外部工具、API和數據庫實現更強大的功能。它們能夠按照預設流程完成一系列操作,如自動化數據分析、文檔處理或信息搜集。
工作流的本質是一個流程圖或者說決策樹。
在Dify中,工作流類型的智能體開發及效果通常是這樣:
(3)對話流類型
對話流類型融合了聊天助手和工作流的特點,它通過預設的對話路徑和決策樹,引導用戶完成特定目標。對話流l類型智能體是最高級的智能體形態,它結合了聊天助手的自然交互和工作流的任務執行能力。這類智能體能在對話中理解用戶需求,動態規劃并執行任務序列,同時保持上下文一致性。
代表性產品如Siri、Google Assistant等多輪對話系統,它們能夠處理復雜意圖解析,并通過多輪交互完成漸進式任務,為用戶提供沉浸式智能體驗。
在Dify中,對話流類型的智能體界面通常是這樣:
智能體類型選擇
不同類型的智能體各有特點,根據應用場景選擇合適的類型可以提升效率和用戶體驗。以下是三種主要智能體類型及其應用建議。
以上就是智能體三種類型的主要內容,下節課我們將重點將圍繞每種類型,講解智能體的組成元素以及制作步驟。
本文轉載自公眾號九歌AI大模型 作者:九歌AI
原文鏈接:??https://mp.weixin.qq.com/s/fEFaFvsNicNAoExnBM2U3w??
