成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Agents需要一個代碼解釋器

譯文 精選
人工智能
在他們的類比中,完全依賴LLM的代理可以被認為是在沒有慢思考的情況下操作,即在沒有深入思考的情況下來快速生成文本。下面是一個例子,說明即使是簡單的任務也可能需要一些系統,而不能憑直覺回答。

作者 | Vasek Mlejnsky

編譯 | 言征

出品 | 51CTO技術棧(微信號:blog51cto)

構建人工智能代理很難。你將與幻覺作斗爭,讓agents智商不掉線,并引導他們使用正確的工具。

不過,方法也不難,其中一種就是賦予代理代碼執行能力。

以下是為什么你的人工智能代理應該有一個代碼解釋器的一些原因。

一、額外技能

具有代碼解釋器的代理可以獲得諸如對CSV文件執行統計分析或繪制圖表之類的功能。

當你向不同的代理請求相同的東西時,很明顯,那些具有底層代碼解釋器的代理有多大的不同。如果不運行代碼,幾乎不可能完成以下任務:

  • 分析NVIDIA的股票并預測其發展。
  • 和人一起玩撲克游戲。
  • 訂一張機票。

我們先來看一下Perplexity(一個沒有代碼解釋器的代理)如何處理數據分析任務。即使提供了數據文件,代理也無法完成任務——它所能做的最好的事情就是提供關于應該運行什么代碼的建議。

圖片圖片

以下是帶有底層代碼解釋器的ChatGPT將如何處理相同的任務…

圖片圖片

…還包括安裝新軟件包和生成圖表。

圖片圖片

請注意,最終用戶不需要意識到應用程序在幕后執行編碼任務,因為主要目標(如“為我預訂航班”)通常不圍繞編碼。

二、復雜推理

大型語言模型(LLM)擅長生成文本,但難以進行推理和復雜思考。

谷歌的團隊對丹尼爾·卡尼曼的名著《思考,快與慢》進行了有趣的類比。執行代碼的能力使代理具有慢思考(努力、邏輯和計算)與快思考(直覺和自動)的能力,并通過代理在沒有代碼解釋器的情況下的行為來表示。

在他們的類比中,完全依賴LLM的代理可以被認為是在沒有慢思考的情況下操作,即在沒有深入思考的情況下來快速生成文本。下面是一個例子,說明即使是簡單的任務也可能需要一些系統,而不能憑直覺回答。

圖片圖片

三、減少LLM幻覺

最近的一篇論文證實,即使在給出推理提示的情況下,LLM也會對多步驟任務產生幻覺。作為論文研究結果的后續,一位軟件工程師展示了使用代碼解釋器式LLM引擎如何成功地將幻覺減少一個數量級。他發現,代碼解釋器可以將GPT-4幻覺率從<10%降低到<1%。

代碼解釋器可以處理上傳和下載,編寫代碼從源文件中查找數據并得出結論,而不是像更簡單的代理通常那樣自由推理。

對抗LLM幻覺的其他方法包括RAG、微調和增加LLM上下文窗口的大小。

四、自己測試代碼

另一個巨大的挑戰是LLM代碼的生成。當代理不僅可以生成代碼,還可以在運行代碼時,它就能夠測試自己輸出的功能并對其進行迭代。

五、使用代碼解釋器構建

作為圍繞LLM構建的新生態系統的一部分,我們將看到代碼解釋器為更多的人工智能代理和應用程序提供動力,在LLM中,代碼解釋器代表了代理大腦的關鍵部分。有關構建的靈感,不妨參閱流行的開源產品,如Open Interpreter或AutoGen。

圖片圖片

當然,仍然有一些挑戰需要克服,例如找到一種安全和最佳的方式來運行LLM生成的代碼,這可以通過在獨立的云環境中執行進程來解決。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://m.ekrvqnd.cn/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2022-06-29 09:02:31

go腳本解釋器

2022-01-05 08:58:08

Python解釋器編程語言

2024-01-31 08:16:38

IPythonPython解釋器

2012-08-14 10:44:52

解釋器編程

2018-08-26 05:38:44

路由器調制解調器網絡設備

2018-12-04 13:30:28

Javascript編譯原理前端

2013-04-25 09:55:21

進程線程

2025-06-27 06:38:19

2019-09-18 15:09:50

進程線程操作系統

2013-03-04 10:22:30

Python

2022-04-28 13:56:10

元宇宙虛擬交易NFT

2023-09-26 16:44:14

光模塊

2014-01-09 09:42:56

Python語言檢測器

2022-06-28 08:17:10

JSON性能反射

2022-07-14 16:18:32

massCode開源

2023-09-15 16:34:41

數據管理數據治理

2014-01-21 09:42:32

Python代碼對象

2014-05-15 09:45:58

Python解析器

2023-12-25 15:28:57

Python工具pywebio

2015-10-27 15:50:47

JS框架
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩一 | 男女羞羞视频网站 | 欧美一级片在线观看 | 成人欧美一区二区三区在线观看 | 色狠狠一区 | 天天射色综合 | 日韩欧美电影在线 | 久久亚洲综合 | 成人欧美一区二区三区1314 | 日韩一区二区av | 久久久久久国产精品免费 | 亚洲国产日韩欧美 | 亚洲一区二区综合 | 中文字幕国产一区 | 天天干亚洲 | 国产高清在线精品一区二区三区 | 欧美一级片中文字幕 | 天天拍天天操 | 91精品91久久久 | 日本精品裸体写真集在线观看 | 自拍偷拍欧美 | 羞羞视频网站免费观看 | 国产一区二区在线播放视频 | 日韩精品一区二区三区免费视频 | 亚洲一区二区三区在线视频 | 国产三级精品三级在线观看四季网 | 日韩欧美亚洲一区 | 日韩成人免费视频 | 91视频观看 | 秋霞电影一区二区三区 | 99久久国产免费 | 亚洲精品一区中文字幕 | 在线视频 欧美日韩 | 欧美精品一区二区三区蜜桃视频 | 日韩午夜影院 | 免费一级片 | 亚洲成人精品久久久 | 精产国产伦理一二三区 | 久久久亚洲一区 | 免费一区 | 免费一级毛片 |