成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI Agent 如何改變我們與網頁的互動方式

人工智能
網頁 AI 智能體通過模仿人類與網站互動的方式工作。它們接收自然語言任務(比如“找一雙 10 號白色鞋子”),用像?Playwright?這樣的工具點擊或輸入,靠獎勵函數評估任務完成情況。

AI 智能體(像 OpenAI Operator 這樣的)能幫你自動完成網上找產品、管理瀏覽器標簽等任務,簡直是解放雙手!但要讓這些智能體真正派上用場,挑戰可不小。這篇文章會聊聊 AI 智能體在網頁互動中的現狀、痛點,以及一個叫 Agentic Web Interfaces (AWIs) 的新解決方案。

圖片圖片

引言

AI 智能體想在網頁上干點有意義的事兒,遠比處理簡單搜索復雜得多。

雖然 MCP (Model Context Protocol) 網頁服務器能幫忙搞定搜索操作,但更大的問題是,網頁是為人類設計的,復雜的界面、動態元素、交互組件,AI 智能體想順暢“讀懂”可不容易。

光靠截圖或試圖解析網頁結構,是一種很粗糙的辦法,缺乏語義理解,自動化效果大打折扣。根本問題在于,網頁內容是為視覺瀏覽設計的,不是給程序直接訪問的,動態內容、復雜布局、交互組件都讓解析變得困難。

MCP 或許能幫上忙,通過提供更結構化的接口,標準化 AI 智能體訪問和操作網頁資源的方式,擺脫對視覺解讀的依賴。但 MCP 生態還在發展,能否應對復雜的網頁導航還得打個問號。

圖片圖片

理想的解決方案是網頁標準能暴露語義結構和功能,給 AI 智能體提供友好格式。但在這種標準普及前,AI 智能體還得在人類導向的網頁設計和程序化訪問需求的差距中掙扎。

回到研究

最近一項研究指出,當前基于瀏覽器和 API 增強的 AI 智能體,因為依賴人類設計的網頁界面,面臨不少挑戰。

網頁瀏覽器是為人類用戶和開發者設計的,不是給 AI 智能體用的。

雖然研究提出了有價值的思考,但缺乏具體細節,沒能完全勾勒出新的交互范式,相比之下,像 arXiv:2505.10609 和 arXiv:2505.22368 這樣的論文提供了更可操作的研究。

不過,研究探索了當前網頁 AI 智能體的現狀、局限性,并提出了一個解決方案:Agentic Web Interfaces (AWIs),還是很值得一聊。

網頁 AI 智能體現在咋工作

網頁 AI 智能體通過模仿人類與網站互動的方式工作。它們接收自然語言任務(比如“找一雙 10 號白色鞋子”),用像 Playwright 這樣的工具點擊或輸入,靠獎勵函數評估任務完成情況。

主要有兩種類型:

基于瀏覽器的 AI 智能體:只跟網站 UI 打交道,通過截圖、Document Object Model (DOM) 樹或可訪問性樹來理解網頁。

API 增強的混合智能體:結合 UI 交互和網頁 API 調用來提高效率,比如直接拉取數據。

這兩種方式都有問題,因為人類設計的界面——復雜 UI 或有限的 API——壓根兒沒為 AI 智能體優化,導致效率低、風險高。

不過,讓 AI 智能體像人類一樣“用”現有網頁,確實有種特別的吸引力。

當前方法的挑戰

基于瀏覽器的 AI 智能體

基于瀏覽器的 AI 智能體靠截圖或 DOM 樹,但各有毛病:

? 截圖會漏掉隱藏元素(比如下拉菜單),DOM 樹解析又費計算資源。

? AI 智能體反復渲染網頁會給服務器添負擔,觸發像 CAPTCHA 這樣的防御機制,影響人類用戶體驗。

? 更糟的是,它們能訪問瀏覽器數據(比如密碼),帶來隱私風險,比如未經授權的購買。

API 增強的混合 AI 智能體

混合智能體用 API 繞過一些 UI 限制,但 API 功能有限,像排序產品這種任務得開發者費老大勁。

頻繁調用 API 還可能觸發速率限制,逼得智能體只能靠低效的 UI 交互。

安全也是個問題,AI 智能體用內部 API 可能繞過像雙重驗證這樣的防護,造成未經授權的訪問和高額使用成本。

研究認為,強迫 AI 智能體適應人類界面是個錯誤方向,提出了 AWIs——專為 AI 智能體設計的接口。

如何打造一個 OpenAI 的計算機使用智能體(CUA 模型)

想建一個能幫你完成任務的計算機使用智能體?用 OpenAI 的 CUA 模型 來創建一個 AI 智能體……(詳情見 cobusgreyling.medium.com)

新范式?Agentic Web Interfaces (AWIs)

AWIs 旨在通過創建一個標準化的、為 AI 智能體優化的交互層來解決問題。研究提出了幾個指導原則:

? AWIs 得標準化以人為本安全高效,還得對開發者友好。

研究還給出了具體建議:

統一的高級動作

AWIs 可以用像“goto”這樣的動作,把多步操作(比如輸入 URL 并按回車)合為一步,保持網站間一致性。

UI 兼容性

像 Playwright 這樣的雙向工具可以同步 AWI 和 UI 狀態,確保與人類瀏覽器兼容。

訪問控制

通過訪問控制列表和生物識別技術,限制 AI 智能體訪問敏感數據,提升安全性。

漸進式信息傳輸

只發送必要數據(比如壓縮后的圖片),能減少帶寬和成本。

任務隊列

限制并發智能體數量,分散使用,能避免服務器過載,也惠及人類用戶。

研究的價值與不足

研究提出 AWIs 的想法很吸引人,點出了人類界面與 AI 能力不匹配的問題。

它關注了計算效率低和安全風險等關鍵問題,提出了一種前瞻性解決方案。

但是……它的建議缺乏實際落地的深度。

比如,沒說清楚怎么在不同網站間標準化 AWIs,也沒量化效率提升。相比之下,像 arXiv:2505.10609 和 arXiv:2505.22368 這樣的研究提供了詳細的網頁智能體設計框架,包括具體算法和評估指標,對開發者更實用。

展望未來

網頁 AI 智能體潛力巨大,但依賴人類設計的界面帶來了效率和風險問題。

AWIs 可能會徹底改變 AI 智能體導航網頁的方式,但研究的高層次想法還需更具體的開發。

責任編輯:武曉燕 來源: PyTorch研習社
相關推薦

2020-05-21 14:25:10

物聯網大數據IOT

2023-07-10 15:07:35

AI學習技術

2020-08-11 07:00:00

人工智能

2025-05-13 00:00:25

AIAgentJSX

2023-06-29 11:11:09

人工智能AI機器人

2018-11-14 09:00:39

Chrome瀏覽器

2023-02-14 10:17:27

物聯網IoT

2019-02-28 05:35:47

物聯網購物IOT

2020-06-08 22:32:07

物聯網銷售方式IOT

2021-11-19 22:49:05

物聯網銷售設備

2024-12-16 18:04:11

2022-08-29 20:06:04

樓宇自控物聯網

2024-03-27 14:51:23

2022-06-16 20:13:08

ARVR

2011-04-15 09:31:22

平板電腦智能手機移動設備

2025-02-03 16:58:39

2024-01-30 10:34:16

邊緣計算云計算管理數據

2022-07-28 10:46:47

智慧城市人工智能物聯網

2020-11-02 17:26:20

人工智能機器學習技術
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲人成人网 | 成人精品高清 | 国产精品福利在线观看 | 91久久国产综合久久 | 黄色片在线 | 中文字幕在线播放不卡 | 国产精品久久久久久久久久 | 国产乱码精品一区二区三区中文 | www.97zyz.com | 少妇精品久久久久久久久久 | 国产乱码精品一区二区三区av | 免费在线观看一区二区 | 看片网站在线 | 91一区二区三区在线观看 | 国产一区二区 | 做a视频在线观看 | 国产1区2区在线观看 | 老头搡老女人毛片视频在线看 | 国产成人福利视频在线观看 | 99久久婷婷国产综合精品首页 | 亚洲国产精品一区二区www | 久久国产精品久久 | 欧美日韩国产中文 | 久久久影院 | 成人精品一区二区三区中文字幕 | 日韩精品区| 精品国产欧美一区二区三区成人 | 黄色一级片aaa | 免费性视频 | 国产91视频免费 | 成年人视频在线免费观看 | 高清一区二区三区 | 精品永久 | 啪一啪 | 国产成人av在线 | 久久精品国产99国产精品亚洲 | 天堂一区二区三区 | 久久久久久成人 | 日韩精品在线一区 | 国产精品美女久久久久久免费 | 欧美色影院|