吳恩達(dá)大佬關(guān)于智能體趨勢(shì)的最新觀點(diǎn)!
大語言模型(LLM)通常被優(yōu)化用來回答人們的問題。但是現(xiàn)在有一個(gè)趨勢(shì)是模型也在被優(yōu)化以適應(yīng)智能體工作流程。這將大大提升智能體的性能!
在ChatGPT在問答方面取得突破性成功之后,大量的LLM開發(fā)都集中在提供良好的消費(fèi)者體驗(yàn)上。因此,LLM被調(diào)教來回答問題("為什么莎士比亞要寫《麥克白》?")或遵循人類提供的指令("解釋為什么莎士比亞寫了《麥克白》")。指令微調(diào)數(shù)據(jù)集中的很大一部分都在引導(dǎo)模型為人類編寫的問題和指令提供更有幫助的回應(yīng),這些問題和指令類似于人們可能會(huì)向面向消費(fèi)者的LLM提出的問題,比如ChatGPT、Claude或Gemini的網(wǎng)頁界面所提供的服務(wù)?!?/p>
但智能體的工作負(fù)載需要不同的行為。AI軟件可能會(huì)在迭代工作流程中使用模型來反思自己的輸出、使用工具、制定計(jì)劃,并在多智能體環(huán)境中協(xié)作,而不是直接為消費(fèi)者生成回應(yīng)。主要的模型開發(fā)商越來越多地優(yōu)化模型,使其也能用于AI智能體?!?/p>
以工具使用(或函數(shù)調(diào)用)為例。如果有人詢問LLM當(dāng)前的天氣,它無法從訓(xùn)練數(shù)據(jù)中得出所需的信息。相反,它可能會(huì)生成一個(gè)API調(diào)用請(qǐng)求來獲取這些信息。即使在GPT-4原生支持函數(shù)調(diào)用之前,應(yīng)用程序開發(fā)者就已經(jīng)在使用LLM生成函數(shù)調(diào)用,但需要編寫更復(fù)雜的提示(比如ReAct提示的變體),告訴LLM有哪些函數(shù)可用,然后讓LLM生成一個(gè)字符串,由單獨(dú)的軟件程序解析(可能使用正則表達(dá)式)來確定是否要調(diào)用函數(shù)?!?/p>
在GPT-4和隨后許多其他模型原生支持函數(shù)調(diào)用之后,生成這樣的調(diào)用變得更加可靠。如今,LLM可以決定調(diào)用函數(shù)來搜索信息用于檢索增強(qiáng)生成(RAG)、執(zhí)行代碼、發(fā)送電子郵件、在線下單等等?!?/p>
最近,Anthropic發(fā)布了其模型的一個(gè)版本,能夠使用計(jì)算機(jī),通過鼠標(biāo)點(diǎn)擊和按鍵操作計(jì)算機(jī)(通常是虛擬機(jī))。我很享受使用這個(gè)演示。雖然其他團(tuán)隊(duì)一直在提示LLM使用計(jì)算機(jī)來構(gòu)建新一代RPA(機(jī)器人流程自動(dòng)化)應(yīng)用程序,但主要LLM提供商原生支持計(jì)算機(jī)使用是一個(gè)重大進(jìn)步。這將幫助很多開發(fā)者!
隨著智能體工作流程的成熟,我觀察到以下趨勢(shì):
- 首先,許多開發(fā)者正在提示LLM執(zhí)行他們想要的智能體行為。這允許快速、豐富的探索!
- 在較少的情況下,從事高價(jià)值應(yīng)用程序開發(fā)的開發(fā)者會(huì)對(duì)LLM進(jìn)行微調(diào),使其更可靠地執(zhí)行特定的智能體功能。例如,即使許多LLM原生支持函數(shù)調(diào)用,它們也是通過接收可用函數(shù)的描述,然后(希望)生成輸出標(biāo)記來請(qǐng)求正確的函數(shù)調(diào)用。對(duì)于生成正確函數(shù)調(diào)用很重要的關(guān)鍵任務(wù)應(yīng)用,針對(duì)應(yīng)用程序特定函數(shù)調(diào)用進(jìn)行微調(diào)可以顯著提高可靠性。(但請(qǐng)避免過早優(yōu)化!今天我仍然看到太多團(tuán)隊(duì)在應(yīng)該花更多時(shí)間在提示上之前就急于進(jìn)行微調(diào)。)
- 最后,當(dāng)某項(xiàng)功能(如工具使用或計(jì)算機(jī)使用)對(duì)許多開發(fā)者來說顯得有價(jià)值時(shí),主要的LLM提供商正在將這些功能直接構(gòu)建到他們的模型中。盡管OpenAI的o1-preview的高級(jí)推理有助于消費(fèi)者,但我預(yù)計(jì)它在智能體推理和規(guī)劃方面會(huì)更加有用。
大多數(shù)LLM主要是為了提供良好的消費(fèi)者體驗(yàn)而優(yōu)化回答問題的能力,我們已經(jīng)能夠?qū)⑺鼈?嫁接"到復(fù)雜的智能體工作流程中來構(gòu)建有價(jià)值的應(yīng)用程序。LLM為原生支持特定智能體操作而構(gòu)建的趨勢(shì)將大大提升智能體的性能。我相信在這個(gè)方向上的重大智能體性能提升將在未來幾年內(nèi)實(shí)現(xiàn)?!?/p>
本文轉(zhuǎn)載自 ??AI 思與行??,作者:cc
