四個優秀AI Agent開源項目,談一談大模型、人工智能代理
什么是AI Agent?
現在我們與大模型的互動,一般的過程是先輸入一個提示詞,之后,大模型根據輸入內容進行計算并響應。每次想要得到一個新的輸出,我們就必須再提供一個提示詞。這個過程有點麻煩,因為總是要有人來驅動。
AI Agent(人工智能代理)則以不同的方式工作。他們被設計成可獨立思考和行動的智能體。我們唯一需要提供的就是一個目標,可以是研究競爭對手分析、寫個網站程序或進行一次旅游。AI Agent會生成一個任務列表,然后開始工作,依靠環境的反饋和自己的內心獨白。就好像它們可以提示自己似的,在不斷發展中適應變化,以最好的方式實現我們制定的目標。
看起來這個過程和自動化流程有點像,但其實有區別。與自動化流程相比,流程是可預知的,用戶可以根據數據或系統狀態設置一系列的觸發器,并配置接下來要執行的活動,然而不同的是,AI Agent可以在存在大量不可預測新信息的環境中工作。這就是AI Agent。
AI Agent有哪些應用場景?
下面是一些應用例子:
- 在一個有25個AI Agent的虛擬城鎮里會發生什么?斯坦福大學和谷歌對此很好奇,所以他們使用OpenAI的API來創建這些虛擬居民,并觀察他們如何生活。為了支持這個實驗,研究小組創建了一個存儲記憶的平臺,以及為每個代理提供目的的基本提示。從那時起,人工智能代理能夠相互分享信息,記住他們關系的細節,甚至計劃情人節派對。
- 在自動駕駛汽車領域,因為AI控制汽車從A點到B,同時保持在路上并遵守交通規則。根據自動駕駛系統的發展,車輛可以相互合作,并與城市基礎設施合作,集成多個智能體的AI系統。
- 可以在計算機中使用的AI Agent,用于完成各種任務。研究工作的過程其實就是一個適合使用AI Agent的場景。因為Agent可以像人類一樣使用筆記本電腦,在互聯網上搜索信息,將其保存在數據庫和文件中,經過總結分析,將其轉化成摘要,最后與你一起驗收結果。
可以想象,未來人類的主要活動就是主導戰略并與其他人建立關系,而AI Agent則可以自動化其他的工作,甚至也可以與其它Agent進行交互,完成人類的目標。
值得關注的開源AI Agent項目
令人印象深刻的AI Agent有許多,但下面是目前最值得關注的前四個。
1.AutoGen
源碼:https://github.com/microsoft/autogen
AutoGen是一個由微軟與OpenAI以及賓夕法尼亞州立大學和華盛頓大學的研究人員合作建立的人工智能代理框架。支持多代理對話,以解決用戶的任務。
可以使用多個代理來開發LLM應用程序,這些代理可以相互配合以解決任務。AutoGen代理是可定制的,可轉換的,并且允許人類參與其中。它們可以在各種模式下運行,這些模式采用LLM,人工輸入和工具的組合。
2.AutoGPT
源碼:https://github.com/Significant-Gravitas/AutoGPT
AutoGPT是一個使用GPT-4創建的完全自主的AI代理。AutoGPT于2023年3月由首席開發商Toran布魯斯理查茲首次發布,他也被稱為游戲公司Significant Gravitas Ltd.的創始人,該公司生產的電腦游戲帶有“道德色彩”,旨在造福和教育全人類。
Auto-GPT是一個實驗性的開源應用程序,展示了GPT-4語言模型的功能。這個程序由GPT-4驅動,可以將LLM的“思想”匯聚、連接在一起,以自主實現用戶設定的任何目標。
CLI:
$ ./run
Usage: cli.py [OPTIONS] COMMAND [ARGS]...
Options:
--help Show this message and exit.
Commands:
agent Commands to create, start and stop agents
arena Commands to enter the arena
benchmark Commands to start the benchmark and list tests and categories
setup Installs dependencies needed for your system.
3.BabyAGI
源碼:https://github.com/yoheinakajima/babyagi
BabyAGI于2023年3月由Yohei Nakajima發布。與AutoGPT類似,也是使用GPT-4來開發的完全自主的聊天機器人。
該系統使用OpenAI和矢量數據庫(如Chroma或Weaviate)來創建、優先處理和執行任務。這個系統背后的主要思想是,它根據先前任務的結果和預定義的目標創建任務。然后,該腳本使用OpenAI的自然語言處理(NLP)功能來創建基于目標的新任務,并使用Chroma/Weaviate來存儲和檢索上下文的任務結果。
BabyAGI通過運行一個無限循環來工作,該循環執行以下步驟:
- 從任務列表中提取第一個任務。
- 將任務發送給執行代理,執行代理使用OpenAI的API根據上下文完成任務。
- 豐富結果并將其存儲在 Chroma或者Weaviate(向量數據庫)。
- 創建新任務并根據目標和上一任務的結果重新確定任務列表的優先級。
4.ChatDev
源碼:https://github.com/OpenBMB/ChatDev
ChatDev是一個可以模擬整個軟件開發團隊的開源對話平臺。由OpenBMB開發,OpenBMB是一個旨在為AGI構建基礎模型和系統的研究實驗室。
ChatDev是一個多代理人的組織結構,以“通過編程徹底改變數字世界”為使命,將代理們團結在一起。ChatDev中的代理通過參加專門的功能研討會進行協作,完成設計、編碼、測試和文檔編制等任務。
ChatDev的主要目標是提供一個易于使用,高度可定制和可擴展的框架,該框架基于大型語言模型(LLM),是一個研究集體智慧的理想場景。
ChatDev的功能包括:集成了版本控制的Git、用于交互式參與設計階段的Human-Agent-Interaction模式,以及用于生成軟件中使用到的圖像的藝術模式。
關于未來
在新技術發展顛覆的過程中,我們總是能聽到一句話:“我們往往太高估短期的作用,低估了未來的影響”。可是AGI這場變革來得太快,以至于我們這種影響和作用在時間上都很是緊迫,甚至有時候有些焦慮。但其實未來已來,唯有積極擁抱。
AI Agent對整個社會能夠產生的影響多大,可能不好預測。但可以肯定的是:我們的生活和工作將在這個發展過程中改變。