成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

吳恩達(dá)大佬關(guān)于智能體趨勢(shì)的最新觀點(diǎn)!

發(fā)布于 2024-11-29 15:17
瀏覽
0收藏

大語言模型(LLM)通常被優(yōu)化用來回答人們的問題。但是現(xiàn)在有一個(gè)趨勢(shì)是模型也在被優(yōu)化以適應(yīng)智能體工作流程。這將大大提升智能體的性能! 

在ChatGPT在問答方面取得突破性成功之后,大量的LLM開發(fā)都集中在提供良好的消費(fèi)者體驗(yàn)上。因此,LLM被調(diào)教來回答問題("為什么莎士比亞要寫《麥克白》?")或遵循人類提供的指令("解釋為什么莎士比亞寫了《麥克白》")。指令微調(diào)數(shù)據(jù)集中的很大一部分都在引導(dǎo)模型為人類編寫的問題和指令提供更有幫助的回應(yīng),這些問題和指令類似于人們可能會(huì)向面向消費(fèi)者的LLM提出的問題,比如ChatGPT、Claude或Gemini的網(wǎng)頁界面所提供的服務(wù)?!?/p>

但智能體的工作負(fù)載需要不同的行為。AI軟件可能會(huì)在迭代工作流程中使用模型來反思自己的輸出、使用工具、制定計(jì)劃,并在多智能體環(huán)境中協(xié)作,而不是直接為消費(fèi)者生成回應(yīng)。主要的模型開發(fā)商越來越多地優(yōu)化模型,使其也能用于AI智能體?!?/p>

以工具使用(或函數(shù)調(diào)用)為例。如果有人詢問LLM當(dāng)前的天氣,它無法從訓(xùn)練數(shù)據(jù)中得出所需的信息。相反,它可能會(huì)生成一個(gè)API調(diào)用請(qǐng)求來獲取這些信息。即使在GPT-4原生支持函數(shù)調(diào)用之前,應(yīng)用程序開發(fā)者就已經(jīng)在使用LLM生成函數(shù)調(diào)用,但需要編寫更復(fù)雜的提示(比如ReAct提示的變體),告訴LLM有哪些函數(shù)可用,然后讓LLM生成一個(gè)字符串,由單獨(dú)的軟件程序解析(可能使用正則表達(dá)式)來確定是否要調(diào)用函數(shù)?!?/p>

在GPT-4和隨后許多其他模型原生支持函數(shù)調(diào)用之后,生成這樣的調(diào)用變得更加可靠。如今,LLM可以決定調(diào)用函數(shù)來搜索信息用于檢索增強(qiáng)生成(RAG)、執(zhí)行代碼、發(fā)送電子郵件、在線下單等等?!?/p>

最近,Anthropic發(fā)布了其模型的一個(gè)版本,能夠使用計(jì)算機(jī),通過鼠標(biāo)點(diǎn)擊和按鍵操作計(jì)算機(jī)(通常是虛擬機(jī))。我很享受使用這個(gè)演示。雖然其他團(tuán)隊(duì)一直在提示LLM使用計(jì)算機(jī)來構(gòu)建新一代RPA(機(jī)器人流程自動(dòng)化)應(yīng)用程序,但主要LLM提供商原生支持計(jì)算機(jī)使用是一個(gè)重大進(jìn)步。這將幫助很多開發(fā)者! 

隨著智能體工作流程的成熟,我觀察到以下趨勢(shì):  

  • 首先,許多開發(fā)者正在提示LLM執(zhí)行他們想要的智能體行為。這允許快速、豐富的探索!
  • 在較少的情況下,從事高價(jià)值應(yīng)用程序開發(fā)的開發(fā)者會(huì)對(duì)LLM進(jìn)行微調(diào),使其更可靠地執(zhí)行特定的智能體功能。例如,即使許多LLM原生支持函數(shù)調(diào)用,它們也是通過接收可用函數(shù)的描述,然后(希望)生成輸出標(biāo)記來請(qǐng)求正確的函數(shù)調(diào)用。對(duì)于生成正確函數(shù)調(diào)用很重要的關(guān)鍵任務(wù)應(yīng)用,針對(duì)應(yīng)用程序特定函數(shù)調(diào)用進(jìn)行微調(diào)可以顯著提高可靠性。(但請(qǐng)避免過早優(yōu)化!今天我仍然看到太多團(tuán)隊(duì)在應(yīng)該花更多時(shí)間在提示上之前就急于進(jìn)行微調(diào)。)
  • 最后,當(dāng)某項(xiàng)功能(如工具使用或計(jì)算機(jī)使用)對(duì)許多開發(fā)者來說顯得有價(jià)值時(shí),主要的LLM提供商正在將這些功能直接構(gòu)建到他們的模型中。盡管OpenAI的o1-preview的高級(jí)推理有助于消費(fèi)者,但我預(yù)計(jì)它在智能體推理和規(guī)劃方面會(huì)更加有用。

大多數(shù)LLM主要是為了提供良好的消費(fèi)者體驗(yàn)而優(yōu)化回答問題的能力,我們已經(jīng)能夠?qū)⑺鼈?嫁接"到復(fù)雜的智能體工作流程中來構(gòu)建有價(jià)值的應(yīng)用程序。LLM為原生支持特定智能體操作而構(gòu)建的趨勢(shì)將大大提升智能體的性能。我相信在這個(gè)方向上的重大智能體性能提升將在未來幾年內(nèi)實(shí)現(xiàn)?!?/p>

本文轉(zhuǎn)載自 ??AI 思與行??,作者:cc

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 日韩中文一区二区三区 | 国产第一页在线观看 | 亚洲精品美女视频 | 日韩在线观看一区 | 狠狠操狠狠操 | 欧美最猛黑人 | 国产精品久久国产精品久久 | 中文字幕在线播放第一页 | av入口| 亚洲午夜精品一区二区三区 | 国产一区二区精 | 国产精品久久久久久久久久久久久久 | 99精品亚洲国产精品久久不卡 | 亚洲日本成人 | 免费一级做a爰片久久毛片潮喷 | 91高清在线 | 久久九精品 | 亚洲一区二区三区免费观看 | 国产黄色在线观看 | 日韩美香港a一级毛片免费 国产综合av | 亚洲综合色丁香婷婷六月图片 | 久久99精品久久久久久秒播九色 | 国产精品久久久久久妇女6080 | 精品久久久久久久久久久久久久 | 久久国产精品久久久久久 | 久久成人综合 | 一区二区三区亚洲视频 | 福利色导航 | 91高清免费观看 | 久久9精品 | 欧美一级二级三级视频 | 成人二区 | 伊人网站视频 | 成年人网站免费视频 | 美女天天干天天操 | 欧美日韩精品一区二区三区视频 | 天天久久 | 久久亚 | 色偷偷噜噜噜亚洲男人 | 日韩中文字幕视频在线观看 | 亚洲伊人久久综合 |