谷歌開發(fā)者大會炸場!Agent重磅升級,?A2A、SDK大更新
今天凌晨,谷歌召開了“I/O 2025”全球開發(fā)者大會,發(fā)布了很多產(chǎn)品包括新視頻模型、代碼模型、文本模型等,尤其是對Agent智能體進(jìn)行了重磅升級。
例如,全新影視級文生視頻模型Flow,創(chuàng)新架構(gòu)小參數(shù)模型Gemma3n,基于AI模型的全新搜索模式等。
下面「AIGC開放社區(qū)」為大家介紹谷歌在第一天開發(fā)者大會上,與Agent智能體相關(guān)的重要內(nèi)容。
A2A協(xié)議大更新
與昨天微軟召開的“Build2025”全球開發(fā)者大會一樣,Agent智能體也是谷歌現(xiàn)階段和未來重要發(fā)展賽道之一。
A2A是谷歌在本月7號剛開源的一個(gè)專門面向智能體的交互協(xié)議,主要用于打破數(shù)據(jù)孤島,對智能體的能力、跨平臺、執(zhí)行效率產(chǎn)生質(zhì)的改變。
現(xiàn)在,谷歌發(fā)布了A2A協(xié)議v0.2版本,增加了眾多關(guān)鍵功能:
1)支持無狀態(tài)交互,在以往許多場景下,智能體間的會話管理較為復(fù)雜,阻礙了高效通信。如今有了這一功能,對于那些無需會話管理的場景,開發(fā)過程得到極大簡化。
例如,在一些簡單的信息查詢類任務(wù)中,一個(gè)智能體只需向另一個(gè)智能體獲取特定數(shù)據(jù),以往可能要經(jīng)歷繁瑣的會話建立、維持與結(jié)束流程。
現(xiàn)在無狀態(tài)交互讓這一過程變得直接而高效,智能體之間可以快速地交換信息,實(shí)現(xiàn)了更輕量化的通信,提升了自動(dòng)化任務(wù)的執(zhí)行效率。
2)引入“智能體卡”概念,這是一種由A2A服務(wù)器發(fā)布的JSON元數(shù)據(jù)文檔,用于描述其身份、能力、技能、服務(wù)端點(diǎn)和認(rèn)證要求。消息、任務(wù)、部分、工件、流式傳輸、推送通知和會話等概念也在協(xié)議中得到了定義,以支持復(fù)雜的交互模式。
例如,智能體卡現(xiàn)在可以明確指出智能體是否支持流式傳輸和推送通知,這使得客戶端能夠更清楚地了解智能體的能力,從而更高效地進(jìn)行交互。
3)文件交換優(yōu)化,在文件交換方面,0.2.0版本引入了更靈活的處理方式。智能體不僅可以直接返回文件的字節(jié)內(nèi)容,還可以提供一個(gè)URI,指向存儲文件的臨時(shí)位置。這使得智能體能夠更高效地處理大文件,同時(shí)也減少了數(shù)據(jù)傳輸?shù)拈_銷。
4)標(biāo)準(zhǔn)化身份驗(yàn)證,基于類似OpenAPI的身份驗(yàn)證模式,正式確定了身份驗(yàn)證方案,確保了智能體間身份驗(yàn)證要求的清晰傳達(dá),增強(qiáng)了智能體間交互的安全性和可靠性。
在多智能體協(xié)作的復(fù)雜網(wǎng)絡(luò)里,不同智能體來自不同的開發(fā)團(tuán)隊(duì)與平臺,過去身份驗(yàn)證方式各不相同,導(dǎo)致智能體之間通信時(shí),安全風(fēng)險(xiǎn)增加且溝通成本變高。
現(xiàn)在,新的標(biāo)準(zhǔn)化身份驗(yàn)證方案使得各個(gè)智能體在交互前,能清晰知曉對方的身份驗(yàn)證要求,無論是使用API密鑰、OAuth還是OIDC等方式,都有了明確規(guī)范。
例如,一家企業(yè)內(nèi)部有多個(gè)不同部門開發(fā)的智能體,財(cái)務(wù)部門的智能體在與銷售部門的智能體協(xié)作處理訂單財(cái)務(wù)相關(guān)任務(wù)時(shí),雙方依據(jù)新的標(biāo)準(zhǔn)化身份驗(yàn)證方案,能快速、安全地完成身份驗(yàn)證流程,保障了數(shù)據(jù)傳輸與協(xié)作的安全性,極大地增強(qiáng)了智能體間交互的可靠性。
此外,為了讓開發(fā)者更輕松地利用A2A協(xié)議,谷歌發(fā)布了官方的A2A Python SDK。這個(gè)專用的SDK提供了使用A2A進(jìn)行交互和構(gòu)建所需的工具,簡化了將這些強(qiáng)大的通信功能集成到基于Python的智能體中的過程。
A2A生態(tài)持續(xù)擴(kuò)大
雖然A2A開源時(shí)間很短,但已經(jīng)有微軟、埃森哲、波士頓咨詢集團(tuán)、凱捷、科睿唯安、Salesforce、德勤、甲骨文、HCL科技、印孚瑟斯、KPMG、SAP、麥肯錫、普華永道等50多家全球著名企業(yè)加入。
例如,微軟宣布在AzureAI Foundry中支持該協(xié)議,以構(gòu)建A2A智能體,并能夠在Microsoft CopilotStudio中調(diào)用任何A2A智能體。微軟還展示了如何通過使用Microsoft EntraAgentID和Microsoft Graph調(diào)用多個(gè)A2A智能體,將A2A用于工作場所生產(chǎn)力場景。
SAP正在其AI助手Joule中添加對A2A協(xié)議的支持,這將使Joule能夠在SAP生態(tài)系統(tǒng)內(nèi)協(xié)調(diào)智能體,并在Joule用戶界面中調(diào)用如使用谷歌ADK構(gòu)建的A2A智能體,這樣用戶就可以訪問多個(gè)系統(tǒng)的智能體來完成更多任務(wù),而無需切換上下文。
BoxAI智能體通過提取日期和合同條款等關(guān)鍵細(xì)節(jié),將掃描件和圖像等非結(jié)構(gòu)化內(nèi)容轉(zhuǎn)化為可操作的數(shù)據(jù)。通過采用A2A協(xié)議,BoxAI智能體可以與外部智能體安全協(xié)作,直接在內(nèi)容所在的位置完成復(fù)雜的多系統(tǒng)流程。
Agent Engine UI
為了幫助開發(fā)者更好的在生產(chǎn)環(huán)境中部署、管理和擴(kuò)展智能體。谷歌發(fā)布了Agent Engine UI引擎界面,以更直接、集中的方式簡化智能體生命周期管理。
UI引擎可在谷歌云控制臺中訪問,提供了一個(gè)全面的儀表板,用于查看和管理已部署的智能體、列出會話、跟蹤和調(diào)試操作以及監(jiān)控智能體。
這種簡化的方法顯著增強(qiáng)了開發(fā)和管理流程,讓開發(fā)者能夠更好地控制智能體,并深入了解其行為和性能。在智能體引擎用戶界面中,開發(fā)者可以檢查已部署的智能體、查看指標(biāo),例如,請求和CPU使用率、會話、檢查部署細(xì)節(jié),并深入了解跟蹤情況。
Agent SDK升級
谷歌對開源的Agent SDK進(jìn)行了升級,發(fā)布了Python ADKv1.0.0版本,為開發(fā)者提供了一個(gè)可靠且強(qiáng)大的平臺,能夠在更復(fù)雜的環(huán)境中快速開發(fā)和部署智能體。
為了擴(kuò)大覆蓋范圍,谷歌還推出了Java ADK v0.1.0的初始版本,將ADK的強(qiáng)大功能和靈活性帶給Java開發(fā)者,使他們能夠在智能體開發(fā)需求中利用其能力。若要開始使用Java ADK,開發(fā)者可在Maven項(xiàng)目中添加相應(yīng)依賴。
多任務(wù)智能體Project Mariner
自去年谷歌公布預(yù)覽版Project Mariner智能體以來,就一直不斷探索其應(yīng)用場景,涵蓋信息查找、預(yù)訂服務(wù)、購物下單、開展研究等多個(gè)方面。在搜索信息時(shí),能快速篩選整合內(nèi)容;
預(yù)訂酒店、機(jī)票時(shí),自動(dòng)匹配符合用戶需求的選項(xiàng);購物時(shí)精準(zhǔn)定位商品;做研究時(shí),高效檢索并梳理資料,極大地節(jié)省了用戶時(shí)間和精力。
現(xiàn)在谷歌進(jìn)一步增強(qiáng)了Project Mariner的能力,不僅能夠獨(dú)立完成任務(wù),還能相互協(xié)作。例如,一個(gè)智能體可以負(fù)責(zé)查找信息,另一個(gè)智能體可以負(fù)責(zé)預(yù)訂,而第三個(gè)智能體可以負(fù)責(zé)支付。這種協(xié)作機(jī)制使得復(fù)雜的任務(wù)能夠被分解為多個(gè)子任務(wù),并由不同的智能體并行處理,從而顯著提高了整體效率。
為了確保用戶能夠輕松地與智能體進(jìn)行交互,Project Mariner提供了一個(gè)直觀的用戶界面。用戶可以通過簡單的語音命令或文本輸入來請求智能體執(zhí)行任務(wù),而智能體則能夠以自然語言的形式提供反饋和結(jié)果。這種友好的用戶界面設(shè)計(jì)使得Project Mariner更易于使用,即使是沒有技術(shù)背景的用戶也能夠輕松上手。
Project Mariner還包含了一些實(shí)驗(yàn)性功能。例如,能夠通過屏幕共享和視頻理解功能,幫助用戶更好地理解和處理復(fù)雜的任務(wù)。這些實(shí)驗(yàn)性功能為未來的人工智能助手提供了新的可能性。
此外,Project Mariner的功能不僅限于瀏覽器,谷歌還計(jì)劃將其擴(kuò)展到更多平臺,包括移動(dòng)設(shè)備和智能眼鏡等。幫助用戶可以在不同的設(shè)備上無縫切換,享受一致的智能體服務(wù)體驗(yàn)。