成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評 原創

發布于 2025-7-18 14:41
瀏覽
0收藏

編輯 | 云昭

出品 | 51CTO技術棧(微信號:blog51cto)

又是一個不眠夜!

7 月對于 OpenAI 而言意義非凡,從去年盛傳 GPT-5 將會發布,再到近日的被挖角風波,再到 OpenAI 即將推出 AI 瀏覽器,各種傳言全都醞釀在今天凌晨的直播里。

發布前,小編的預期是,肯定是 Agentic 辦公類的產品。因為在前兩個月的博客中,Sam Altman 不止一次提及,現在是 Vibe Coding,下一個則看好類似 Google Docs 的辦公 Agent 產品。

這次,Sam 在官宣發布推文后,給出的第一條推文總結了他的感受:

“feel the AGI” moment。 

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

“觀看 ChatGPT Agent 使用計算機思考、計劃和執行復雜任務對我來說是一個真正的‘感受 AGI’時刻。”

合二為一的縫合怪?

果然,小編只猜中了一半。猜對的是果真是面向日常辦公工作的產品,主打一個 一句提示搞定 Excel 和 PPT。

正如那位 OpenAI 的研究員所發的推文:

在對各種實際工作任務(可能需要> 10 小時的專家任務)進行測試時,我們發現其輸出幾乎在 50% 的時間內都達到了人類質量。

沒猜到的是,Altman 坦承了想法:很簡單,我們就是融二為一了。

省流版的解釋,這個 Agent 就是兼有下面兩種功能,研究和動手兩不誤——

  • Operator:可與網頁交互,如填寫表單、點擊按鈕等;
  • Deep Research:可執行多步驟的深入研究任務。

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

這次直播中,Sam Altman 表示,ChatGPT Agent 的想法是在 OpenAI 推出其其他代理 Operator 和 Deep Research 之后產生的。Operator 使用自己的瀏覽器執行任務,而 Deep Research 可以在互聯網上進行多步驟調查。

“我們很清楚,人們真正想要的是將這些功能整合在一起……人們想要一個統一的代理,它可以獨立運行,使用自己的電腦,并為他們執行真正復雜的任務。”

OpenAI 表示,這款新工具可以“使用它自己的電腦”來處理復雜任務。

不過,在人類看來,這里的復雜任務,算不上多復雜。無疑就是我們日常辦公的那些事兒了:讀/發郵件、做PPT、編輯 Excel、網上購物等等。

為什么仍然值得一看?

但如果說這次給的演示有什么特別的話,就是場景更加貼近實際生活工作了:

  • ChatGPT 代理可以充當虛擬助手,連接到 Gmail 和 Google 日歷等應用程序,執行起草電子郵件和安排預約等任務。它使用自己的虛擬計算機完成任務,并自行在推理和行動之間切換以執行指令。
  • OpenAI 表示,新工具可以“分析三個競爭對手并制作幻燈片”——代理將制定行動方案、瀏覽網站并創建可編輯的幻燈片。
  • 它還可以通過“根據舊金山年度綜合財務報告 (ACFR) 制作電子表格”之類的提示來創建可編輯的 Excel 電子表格。
  • 該代理還可以為用戶在線購物,但在執行敏感操作(例如輸入個人信息或進行購買)之前,它始終會征求批準。

這些任務的完成并非通過傳統編程接口調用,而是由 ChatGPT 自己在一個虛擬計算機環境中完成,這個環境配備了多種工具,能在網頁上模擬真實用戶的操作。

用戶還可以授權連接自己的 Gmail、GitHub 等服務,讓 ChatGPT 在任務中調用其中的信息。

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

這里小編為大家扒了看下兩個案例:PPT 和 Excel。

至于原理,OpenAI 介紹道,Agent 模式可以調用三種工具:文本瀏覽器、可視化瀏覽器和終端。模型可以自主選擇切換各種工具。

具體來說,文本瀏覽器用于廣泛地讀取和檢索文字信息;可視化瀏覽器則在確定目標信息后,模擬鼠標和鍵盤操作,甚至可以處理圖像內容;而終端則具備執行代碼的能力,能夠生成如 PPT、Excel 等各類文檔,同時還可以調用云端 API 完成更復雜的任務,比如投行建模這些燒腦的事情。

總之,ChatGPT Agent 會動態選擇最佳執行路徑:它可以篩選結果、運行代碼,甚至生成幻燈片和電子表格——同時在多步驟任務中保持完整上下文

這里小編還要強調三個不同的地方:

  • 大家都知道,目前大模型不是萬能的,但大模型調用工具的能力可以說是“愛無限”。在演示中,Agent 可以連接 Google Drive API,讀取文件之后生成更精準的 PPT 或郵件、表格;也可以調用 Image 生成器/生成模型,來實現文本到多模態的跨越(想起了騰訊元寶讓DeepSeek畫圖的消息~)
  • 對于涉及到隱私風險的操作,通知并得到用戶的交互許可,依舊是主流。
  • Agent 的安全風險問題依舊嚴峻。OpenAI 隨后在官方推文中表示,ChatGPT 具備新能力的同時,也引入了新的風險。目前,OpenAI 已針對多個風險類別實施了廣泛的安全防護措施

尤其是針對 對抗性提示注入(prompt injection)攻擊采取了特別的防護機制,以防止模型被惡意操控。(似乎是在暗懟最近Claude和Grok的安全問題。)

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

有趣的是:機構叫好,用戶喊沒勁

好了,現在來說下大家的評價。

首先,發布后,很多人都覺得跟 Manus 很像,群里也有不少朋友對其表示失望。這種心情很普遍,也是大眾對于 OpenAI 產品的過高期望。

比如一位網友就吐槽“生成的 PPT Slides 很丑”。這一點 OpenAI 也承認:

目前,部分功能如幻燈片生成仍處于 beta 階段,排版可能不夠完美,某些編輯也還存在邊界。但這只是開始。OpenAI 正在持續優化:

幻燈片排版更自然

表格編輯速度更快

任務記憶和長期計劃能力增強

循環任務的設置更便捷

其次,更多的網友,是覺得這次的演示Demo無新意,不夠驚艷。

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

最后,甚至、網友們反問道:它幫我完成90~95%的占用我時間的工作后,那我豈不是被解雇了?

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

你看,這就是發布不驚艷的下場,用戶的槽點就會轉移到“AI替代我工作”的話題上,蠻無聊的。

不過,hackernews 上的用戶的注意力就很極客,更多的是在討論電子表格的案例。

他打開表格說:“我覺得它98%的信息都正確……我只需要復制/粘貼幾項。如果它能幫你完成90%到95%的耗時工作,那能幫你省下一大筆時間。”

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

喜歡說出真相的網友則表示:找到剩下的 2% 的錯誤才是最麻煩最難得,可能需要我花費更多的時間!要命!

爭議也由此展開了:

  • 類比到編程,有網友評論指出“AI代碼生成”也存在類似風險:通過測試不代表質量合格,測試無法發現所有漏洞,尤其是邏輯和架構上的錯誤。
  • 同時也有反對者強調:“測試是找你已知問題的工具,但不是萬能的”,必須配合審查流程、代碼理解和良好的工程文化。

哈哈,只能說,這是另一個話題了。

做產品,OpenAI 不是唯一正確,但參考它準沒錯

但小編想說的是,全球 AI 發展早已經不是 OpenAI 一家驅動了,谷歌、Anthropic 已經鼎足。所以彼此之間、甚至模型和 Agent 產品之間的“左腳踩右腳”的發展態勢會長期存在。期望 OpenAI 領跑產品形態這件事,不要抱太大期望。

那肯能會問,OpenAI 這次發了什么新東西嗎?小編認為還是有的。

試想一下,你有沒有在安裝試用某款AI瀏覽器時,總是會被這樣一段文字勸退:

你需要同意授權該產品可以收集、使用真實網頁中用戶數據,并可以執行操作。

這樣帶來的問題怎么解決?這個其實是很多廠商有意回避、沒有解決方案的。

Agent 若獲得過多數據訪問權限,可能誤讀并采取不當行動了怎么辦?

有惡意網站試圖誘導 Agent 執行非法操作該怎么辦?

Agent 可能誤點按鈕、選擇錯誤商品、產生不可預期后果又來誰負責?

至少,OpenAI 帶頭提出了標桿式的解決措施:

  • 關鍵操作需確認(如購物、付款等)
  • 拒絕執行高風險任務(如銀行轉賬)
  • 支持隨時刪除瀏覽記錄與登出
  • 敏感輸入不會被記錄或存儲

除此之外,還有嗎?小編只能說,Spreadsheets 那個也是個不錯的用例。

很多做數據爬蟲工具的網站、甚至BI賽道的玩家都要重新思考將來的轉型了。

如果不相信,就看一下OpenAI 的內部測試數據,以及Epoch AI 剛剛出爐的測評——

  • 在多項復雜的數據科學與投資任務中超過人類表現
  • 在網頁瀏覽與任務完成的準確性上優于歷代AI模型
  • 在表格編輯、數據建模、高階數學問題上表現極佳

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

華人新面孔:Agent背后的兩位高材生

ps: 小編發現,這次又有新的華人面孔。左二,Zhiqing Sun ,去年 6 月加入OpenAI,目前是研究科學家,一口中式英語,非常親切,細心地網友認出就是北大校友孫之清了。

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

在OpenAI期間,孫之清不僅參與到了o3/o4-mini、計算機使用智能體,以及Deep Research這幾個關鍵項目當中,而且還是Deep Research的研究負責人。

另一位坐在C位的則是老面孔:Casey Chu,于2020年4月加入OpenAI,擔任研究員。這位可以說是元老級別了,很多次直播發布中都有看到 Casey。他不僅是DALL·E 2的共同一作,而且還主導了GPT-4視覺輸入的初始原型的開發。

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

什么時候用上?

OpenAI 這波新品正在被嵌入到 ChatGPT 中,目前只允許付費用戶使用。

通過在 ChatGPT 的下拉工具菜單中選擇“代理模式”即可訪問。該代理現已從今天開始向 Pro、Plus 和 Team 用戶推出,并計劃于今年夏季向企業版和教育版用戶推出。

不過,小編發現,身為plus用戶的我,貌似并沒有被cover到,有知道原因的道友可以告訴下原因。

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

不過,小編為大家找到了幾張提前體驗的用戶交互截圖。

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區


又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

最有意思的是,Manus 今天官推也發了幾張對比截圖,嘲諷味道出來了??

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評-AI.x社區

完結。各位大佬如何看待這次的ChatGPT Agent呢?


?本文轉載自???51CTO技術棧??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-7-18 15:12:04修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 好姑娘影视在线观看高清 | 97国产精品视频人人做人人爱 | 欧美亚洲另类在线 | 日本黄色大片免费 | 色综合久久天天综合网 | 亚洲综合在线播放 | 国产精品久久久久不卡 | 日韩精品成人 | 一区二区三区视频在线观看 | 精久久久| 日韩成人在线免费视频 | 国产伊人精品 | 毛片在线看片 | 亚洲欧美日韩中文在线 | 91免费视频 | 日韩精品一区二区三区免费视频 | 精品国产欧美日韩不卡在线观看 | 在线国产小视频 | 欧美日韩高清在线一区 | 精品久久国产 | 中文字幕亚洲一区二区三区 | 九九一级片 | 日韩精品一区二区三区在线播放 | 黄色av网站在线观看 | 日韩在线中文 | av黄色在线 | 国产精品美女久久久久久免费 | 夜夜夜夜草| 久久大陆 | 96国产精品久久久久aⅴ四区 | 亚洲欧美日韩在线 | 欧美激情va永久在线播放 | 狠狠草视频 | 在线黄av | 久久小视频 | 国产成人叼嘿视频在线观看 | 久久影音先锋 | av一二三区 | 韩日一区 | 久久国内 | 国产精品成人一区二区三区夜夜夜 |