弄明白智能體的運作流程，才能知道智能體目前存在那些問題，以及應(yīng)該怎么解決原創(chuàng)

發(fā)布于 2025-6-13 06:40

瀏覽

0收藏

“ 智能體的運作流程非常復(fù)雜和不可控，因此需要其它解決方案來解決這些問題。”

從結(jié)構(gòu)上來看智能體的實現(xiàn)非常簡單，就是大模型LLM+工具Tools；而構(gòu)建工具主要有兩種方式，F(xiàn)unction call和MCP協(xié)議。但由于智能體是由大模型自己決定怎么使用工具，以及怎么處理工具需要的參數(shù)和返回值。

而這個過程對技術(shù)人員是完全不可控的，因此這一點也是智能體執(zhí)行過程中主要的困難點和風(fēng)險點；特別是在多鏈路的工具調(diào)用過程中，比如說讓模型找到某個景點附近的酒店，并根據(jù)要求訂房間。

弄明白智能體的運作流程，才能知道智能體目前存在那些問題，以及應(yīng)該怎么解決-AI.x社區(qū)

這個時候智能體就需要先執(zhí)行搜索的功能，再執(zhí)行下單的功能；而如果在復(fù)雜業(yè)務(wù)場景中，可能需要的鏈路更長，需要的工具更多；但大模型在這種長距離的思維鏈路中，很容易產(chǎn)生問題。

因此，才有了多智能體架構(gòu)的出現(xiàn)，也就是每個智能體只負(fù)責(zé)單一的功能邏輯，然后把多個智能體組合成一個大的復(fù)雜的智能體。但這樣同樣會產(chǎn)生一些問題，那就是多智能體之間的通訊問題。

而且，在真實的業(yè)務(wù)場景中，很多業(yè)務(wù)功能不僅僅只依靠智能體來完成，可能還需要其它業(yè)務(wù)處理或人工參與；這時一旦出現(xiàn)問題，怎么快速定位問題和解決問題是一個需要思考的問題。

而解決這些問題的前提，就是我們要明白智能體的執(zhí)行邏輯，這樣我們才能知道智能體執(zhí)行出現(xiàn)問題可能產(chǎn)生的原因。

智能體的執(zhí)行流程

事實上很多人認(rèn)為的智能體就是給大模型加一些外部工具，而由此組成的結(jié)構(gòu)就是一個智能體；包括作者剛開始也是這么認(rèn)為，這種想法雖然不能說有錯；但事實上存在一些認(rèn)知偏差，或者說這可以認(rèn)為是狹義上的智能體。

智能體（Agent）是指能夠感知環(huán)境并采取行動以實現(xiàn)特定目標(biāo)的代理體。它可以是軟件、硬件或一個系統(tǒng)，具備自主性、適應(yīng)性和交互能力。智能體通過感知環(huán)境中的變化（如通過傳感器或數(shù)據(jù)輸入），根據(jù)自身學(xué)習(xí)到的知識和算法進行判斷和決策，進而執(zhí)行動作以影響環(huán)境或達(dá)到預(yù)定的目標(biāo)。

以上是百度百科關(guān)于智能體的定義，從上面可以看出智能體并不是簡單的多模型+工具；而是一個能夠感知環(huán)境并采取行動以實現(xiàn)特定目標(biāo)的代理體，其主要特點是具備自主性，適應(yīng)性和交互能力。

所以只需要具備上述特征的系統(tǒng)都可以被稱為智能體；而目前的智能體主要依靠大模型來實現(xiàn)，原因就在于目前的大模型具備很強的自主規(guī)劃能力，然后還可以使用外部工具執(zhí)行動作。

弄明白智能體的運作流程，才能知道智能體目前存在那些問題，以及應(yīng)該怎么解決-AI.x社區(qū)