弄明白智能體的運作流程,才能知道智能體目前存在那些問題,以及應(yīng)該怎么解決 原創(chuàng)
“ 智能體的運作流程非常復(fù)雜和不可控,因此需要其它解決方案來解決這些問題。”
從結(jié)構(gòu)上來看智能體的實現(xiàn)非常簡單,就是大模型LLM+工具Tools;而構(gòu)建工具主要有兩種方式,F(xiàn)unction call和MCP協(xié)議。但由于智能體是由大模型自己決定怎么使用工具,以及怎么處理工具需要的參數(shù)和返回值。
而這個過程對技術(shù)人員是完全不可控的,因此這一點也是智能體執(zhí)行過程中主要的困難點和風(fēng)險點;特別是在多鏈路的工具調(diào)用過程中,比如說讓模型找到某個景點附近的酒店,并根據(jù)要求訂房間。
這個時候智能體就需要先執(zhí)行搜索的功能,再執(zhí)行下單的功能;而如果在復(fù)雜業(yè)務(wù)場景中,可能需要的鏈路更長,需要的工具更多;但大模型在這種長距離的思維鏈路中,很容易產(chǎn)生問題。
因此,才有了多智能體架構(gòu)的出現(xiàn),也就是每個智能體只負(fù)責(zé)單一的功能邏輯,然后把多個智能體組合成一個大的復(fù)雜的智能體。但這樣同樣會產(chǎn)生一些問題,那就是多智能體之間的通訊問題。
而且,在真實的業(yè)務(wù)場景中,很多業(yè)務(wù)功能不僅僅只依靠智能體來完成,可能還需要其它業(yè)務(wù)處理或人工參與;這時一旦出現(xiàn)問題,怎么快速定位問題和解決問題是一個需要思考的問題。
而解決這些問題的前提,就是我們要明白智能體的執(zhí)行邏輯,這樣我們才能知道智能體執(zhí)行出現(xiàn)問題可能產(chǎn)生的原因。
智能體的執(zhí)行流程
事實上很多人認(rèn)為的智能體就是給大模型加一些外部工具,而由此組成的結(jié)構(gòu)就是一個智能體;包括作者剛開始也是這么認(rèn)為,這種想法雖然不能說有錯;但事實上存在一些認(rèn)知偏差,或者說這可以認(rèn)為是狹義上的智能體。
智能體(Agent)是指能夠感知環(huán)境并采取行動以實現(xiàn)特定目標(biāo)的代理體。它可以是軟件、硬件或一個系統(tǒng),具備自主性、適應(yīng)性和交互能力。智能體通過感知環(huán)境中的變化(如通過傳感器或數(shù)據(jù)輸入),根據(jù)自身學(xué)習(xí)到的知識和算法進行判斷和決策,進而執(zhí)行動作以影響環(huán)境或達(dá)到預(yù)定的目標(biāo)。
以上是百度百科關(guān)于智能體的定義,從上面可以看出智能體并不是簡單的多模型+工具;而是一個能夠感知環(huán)境并采取行動以實現(xiàn)特定目標(biāo)的代理體,其主要特點是具備自主性,適應(yīng)性和交互能力。
所以只需要具備上述特征的系統(tǒng)都可以被稱為智能體;而目前的智能體主要依靠大模型來實現(xiàn),原因就在于目前的大模型具備很強的自主規(guī)劃能力,然后還可以使用外部工具執(zhí)行動作。
那為什么說由大模型+工具實現(xiàn)的智能體是狹義上的智能體呢?
因為,這樣是最簡單的智能體結(jié)構(gòu);但真實場景中的業(yè)務(wù)流程遠(yuǎn)遠(yuǎn)超過了這種簡單結(jié)構(gòu)的處理能力;所以,才需要在智能體系統(tǒng)中加入工作流,用戶接口等。
并且,為了保證系統(tǒng)的正常運行和中斷運行,需要在系統(tǒng)中斷之后還能恢復(fù)到之前的狀態(tài),因此還需要保存智能體執(zhí)行過程中的實時數(shù)據(jù)。
而這些操作雖然從理論上說起來很簡單,但在實際操作過程中卻面臨著各種各樣的問題和困難點;特別是隨著智能體架構(gòu)的調(diào)整,其某些功能點可能需要重新設(shè)計和實現(xiàn)。
而由于大模型本身的不確定性,更為整個智能體系統(tǒng)增加了更多的不可控因素。
比如說這時可能需要進行容錯處理,在大模型執(zhí)行出現(xiàn)問題時,能夠提供重試機制或人工介入處理等。
本文轉(zhuǎn)載自??AI探索時代?? 作者:DFires
