GenAI的新潮流:如何利用智能體的力量
AI和機器學(xué)習(xí)的發(fā)展歷程是顛覆性的。最初,我們從手動編碼轉(zhuǎn)向通過數(shù)據(jù)訓(xùn)練計算機。在早期階段,AI只能處理特定任務(wù),例如分類和物體識別——這些是它們經(jīng)過明確訓(xùn)練后能夠執(zhí)行的功能。
但這一切在2022年底隨著OpenAI推出ChatGPT而發(fā)生了改變,這一突破性工具不僅可以生成內(nèi)容,還能執(zhí)行各種任務(wù),迅速吸引了全球數(shù)百萬人的關(guān)注。正如Gartner在2023年AI技術(shù)成熟度曲線中所指出的那樣,GenAI已經(jīng)達到了“膨脹期的頂峰”,預(yù)計將在未來5到10年內(nèi)進入“生產(chǎn)力平臺期”。
克服挑戰(zhàn)與局限性
根據(jù)Gartner的定義,達到生產(chǎn)力平臺期意味著AI將被廣泛采用,其優(yōu)勢將得到明確定義,并有清晰的實施指南。要實現(xiàn)這一目標(biāo),我們首先必須解決當(dāng)前AI技術(shù)的局限性,并探索如何通過智能體來克服這些挑戰(zhàn)。
盡管當(dāng)今的大型語言模型(LLMs)在生成電子郵件、寫作文章和進行情感分析等任務(wù)上表現(xiàn)出色,但它們在處理復(fù)雜任務(wù)時仍然存在困難,例如復(fù)雜的數(shù)學(xué)計算或多步驟問題解決。此外,LLMs還存在其他顯著的局限性:
? 幻覺或誤導(dǎo)性輸出
? 技術(shù)限制,如有限的上下文長度和內(nèi)存
? 輸出中的偏見
? 可能產(chǎn)生有害或不當(dāng)言論
? 知識有限(例如,ChatGPT 3.5的知識截止日期為2021年9月)
有趣的是,這些挑戰(zhàn)與我們?nèi)祟愃媾R的問題并無太大不同。我們也容易犯錯誤、存在偏見、記憶有限,有時甚至?xí)龀鲇泻Φ幕貞?yīng)。為了管理這些不足,我們通常會:
? 在線尋找信息,使用Excel和Word等工具。
? 多次修改我們的工作以糾正錯誤并提高質(zhì)量。
? 尋求同事和導(dǎo)師的反饋,并吸收他們的見解。
? 團隊合作以取得更好的結(jié)果。
通過應(yīng)用類似的策略,我們可以改進大型語言模型(LLM)的輸出,從而引出GenAI智能體的概念。
什么是GenAI智能體?
GenAI智能體旨在克服當(dāng)前LLM的許多局限性,能夠執(zhí)行單一模型無法處理的復(fù)雜任務(wù)。例如,如果你想從一個數(shù)據(jù)集中識別出按收入排名前三的公司,智能體將會:
? 獲取所有公司的收入數(shù)據(jù)。
? 按收入對公司進行排序。
? 返回排名前三的公司。
為了實現(xiàn)這一目標(biāo),智能體將LLM與關(guān)鍵組件結(jié)合起來,如規(guī)劃、記憶和工具:
? 規(guī)劃:智能體使用LLM制定并執(zhí)行計劃。
? 記憶:智能體在執(zhí)行多個步驟時保留信息,從而能夠處理復(fù)雜任務(wù)。
? 工具:智能體使用各種工具來執(zhí)行特定任務(wù),以下將對此進行更詳細的討論。
GenAI智能體的關(guān)鍵特性
GenAI智能體被設(shè)計為:
? 規(guī)劃和執(zhí)行任務(wù)
? 反思結(jié)果
? 使用工具實現(xiàn)特定目標(biāo)
? 在最少的人工干預(yù)下運行
此類智能體的例子包括網(wǎng)站建設(shè)工具、從Excel表格中提供見解的數(shù)據(jù)分析師,以及根據(jù)用戶輸入規(guī)劃旅行的旅游代理。
工具在GenAI智能體中的作用
工具對于智能體至關(guān)重要,使其能夠有效地執(zhí)行任務(wù)。在GenAI的領(lǐng)域中,工具使LLM智能體能夠與外部環(huán)境和應(yīng)用程序進行交互,例如進行互聯(lián)網(wǎng)搜索、代碼解釋器和數(shù)學(xué)引擎等,這些工具可以訪問數(shù)據(jù)庫、知識庫以及外部模型。
例如,一個旅行代理需要工具來搜索和預(yù)訂航班,還需要搜索互聯(lián)網(wǎng)的工具。其他工具可能包括:
? 實體提取:從非結(jié)構(gòu)化文檔中提取特定信息。
? Chat DB:無需SQL知識即可從數(shù)據(jù)庫中檢索信息。
? 知識機器人:使用檢索增強生成(RAG)技術(shù),根據(jù)自定義知識庫回答問題。
? 互聯(lián)網(wǎng)搜索:根據(jù)用戶查詢從搜索引擎獲取內(nèi)容。
? 摘要生成:為大型文檔提供針對特定角色的摘要。
? 程序執(zhí)行:執(zhí)行Python代碼以解決特定問題。
? 維基百科搜索:根據(jù)用戶查詢從維基百科檢索內(nèi)容。
? 比較:回答比較性問題,如性能指標(biāo)或產(chǎn)品推薦。
智能體設(shè)計模式
為了執(zhí)行復(fù)雜任務(wù),智能體必須有效地協(xié)調(diào)這些工具。基于Andrew NG的講座,已經(jīng)出現(xiàn)了幾種智能體設(shè)計模式:
? 反思:LLM評估自己的工作以改進輸出。
? 工具使用:LLM利用工具,如網(wǎng)絡(luò)搜索或代碼執(zhí)行,來收集信息和處理數(shù)據(jù)。
? 規(guī)劃:LLM制定多步驟計劃以實現(xiàn)目標(biāo),然后執(zhí)行該計劃。
? 多智能體協(xié)作:多個AI智能體協(xié)作,分配任務(wù)并討論想法,以尋找更好的解決方案。
盡管前兩種模式會產(chǎn)生可預(yù)測的結(jié)果,但后兩種仍處于實驗階段。
LLM智能體框架
基于對智能體、工具和設(shè)計模式的理解,規(guī)劃模式的一種變體逐漸形成。這個框架包括定義一個任務(wù)或目標(biāo),然后通過迭代的方式規(guī)劃并執(zhí)行下一個動作,接著進入反饋循環(huán)。
一個LLM智能體由核心組件組成:
? 大腦/LLM:作為協(xié)調(diào)者。
? 記憶(向量數(shù)據(jù)庫):存儲中間步驟和結(jié)果。
短期記憶:在上下文窗口內(nèi)保存上下文信息。
長期記憶:一個外部的向量存儲,提供相關(guān)的上下文信息。
? 工具/互聯(lián)網(wǎng):使智能體能夠執(zhí)行任務(wù),如網(wǎng)絡(luò)搜索或程序執(zhí)行。
? 政策:通過設(shè)計確保信任,防止處理有害輸入。
智能體的未來
GenAI的未來在于智能體與人類的協(xié)作。試想一個世界,醫(yī)生、設(shè)計師和客戶服務(wù)代表都由增強其能力的智能體支持。從科學(xué)發(fā)現(xiàn)到藝術(shù)創(chuàng)作,可能性是無窮的。
對于企業(yè)而言,將GenAI智能體融入運營中可以帶來戰(zhàn)略優(yōu)勢,釋放出新的效率提升、個性化服務(wù)和問題解決能力,這些智能體不會取代人類的創(chuàng)造力,而是會增強它,推動一個充滿創(chuàng)新和進步的未來。