成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

擠爆字節服務器的Agent到底啥水平?一手實測來了

人工智能 新聞
我們用光了一天的對話額度,考驗了扣子空間 (Coze Space)的信息整理、任務執行、工具調用等多項技能。

“字節版Manus”有多能打?量子位實測在此。

△扣子智能體生成的活動介紹網頁

我們用光了一天的對話額度,考驗了扣子空間(Coze Space)的信息整理、任務執行、工具調用等多項技能。

結果,仍處在早期測試中的扣子空間整體表現已經相當驚艷,在自主任務規劃和資料搜集方面表現不錯,已經具備解決很多真實任務的潛力。

不過在指令遵循方面,還是比較“有自己的想法”。

圖片

簡單介紹一下,扣子空間是字節在剛剛過去的周末推出的智能體協作系統,官方主打“你和AI Agent協同辦公的最佳場所”。

由于放出來的demo效果驚艷,過去幾天里還出現了擠爆服務器的場面。

圖片

而第一波拿到邀請碼的幸運兒,在體驗后也第一時間分享了使用感受:

對比智能體確實是一個大飛躍。

圖片

更適合用來分析報告,主要作用是幫助用戶搭起整體框架。

圖片

當然,作為幸運兒之一,我們也趕緊進行了一波實測。

有腦有手的通用智能體

扣子平臺的通用智能體,分成了探索和規劃兩種模式,官方的介紹是這樣的:

圖片

實際用下來的話,探索模式更注重效率,而規劃模式則會對任務進行詳細拆分,條理更加清晰。

自動整理搜集信息,一句話制作網頁/PPT

先來看探索模式,我們讓它整理了一下波音747系列飛機的發展歷程。

可以看到,智能體根據給出的話題自行擴展延伸了許多搜索詞并執行了檢索,最后形成了一份文字報告。

圖片

利用整理好的資料,可以直接制作出一個網頁(或者PPT也可以),頁面包含了比較豐富的內容,排布簡潔,美觀性也說得過去。

圖片

并且除了文字內容,生成網頁時智能體還補充了產量統計圖和關鍵時間線。

圖片

有腦還有手,自主規劃執行任務

在規劃模式下,扣子智能體不僅會整理資料,還支持在虛擬沙盒環境中操縱電腦、瀏覽網頁,執行訂票等操作。

比如我們讓它幫忙訂一張明天(23日)下午從北京到上海的高鐵票。

比較有意思的是,智能體一開始的動作是搜索高鐵票該怎么訂,不清楚是模型自己真的不知道,還是這里強制設定了檢索過程,但總之,如果真遇到不會的技能,通過檢索來彌補也不失為一種策略。

圖片

12306平臺需要登錄才能進行訂票,智能體能夠準確識別到這種狀況,并提示我們手動接管。

圖片

不過,可能是沙盒環境受到了限制,在執行檢索之后頁面并未顯示結果,因此整個流程未能順利完成。

圖片

但從智能體的操作過程來看,網頁信息識別和規劃執行能力已經很不錯了。

接入MCP,智能體不再“孤軍奮戰”

除此之外,扣子也支持MCP協議,并接入了飛書文檔、GitHub、MySQL數據庫、天氣、地圖等一系列MCP應用。

于是結合MCP,我們來整個大活。

上周,量子位中國AIGC產業峰會2025成功舉行,我們將其會議流程和嘉賓信息整理到了一份文檔當中,要求智能體將這些材料整理出一份網頁版會議指南。

并且還調用了地圖、天氣和語音合成三個MCP插件,在網頁中加入天氣預報、交通指南和嘉賓介紹語音播報。

圖片

可以看到,智能體首先利用工具從文檔中提取出文本,然后通過MCP協議調取了天氣、地圖等信息。

圖片

由于任務比較復雜,制作耗時也比較長,第一版成品長這樣:

圖片圖片

這個版本,要求的內容都有呈現,但是活動流程沒有遵循要求的格式,天氣預報的日期也不對。

所以我們針對這兩點要求智能體進行修改,修改的過程沒有一步到位,而是經過了多輪調整。

以及到后面修改的過程才發現,扣子智能體一開始偷懶并沒有合成嘉賓介紹的語音,只是在網頁里放了按鈕,單獨指出之后才開始合成。

不過最終還是得到了符合期待的頁面,該有的內容都正常展現,滑動和點擊查看詳情的功能都成功實現,合成的音頻也能正常播放。

圖片圖片

雖然整體經歷了不短的時間,但對于一個完全不懂網頁制作的用戶而言,扣子智能體已經很好地解決了工具有無的問題。

在時間上,一個可以改進的方向是讓可以并行進行的任務同時進行,比如這個任務當中的語音合成實際上是獨立于網頁設計的,而智能體目前采用的是串行方式,帶來了不少的額外耗時。

總結一下,作為一個通用智能體,扣子智能體的任務規劃比較合理,資料搜集能力也表現不錯,不過在指令遵循方面,還是比較“有自己的想法”。

當然作為通用智能體,優先考量是提升技能的豐富度,盡可能覆蓋更多的任務,所以在具體任務細節上,也還有不少提升空間。

更懂行的專家智能體

所以,在通用Agent之外,扣子空間還提供了「專家模式」

Beta測試版首頁,目前有兩個專家Agent:

  • 用戶研究專家:模型學習了字節資深用研專家、產品經理等分享的用研工作技巧;
  • 華泰A股觀察助手:扣子團隊與華泰證券聯合孵化的Agent,讓模型學習了如何分析上市公司和發展潛力等專業知識。

圖片

我們實測下來發現,吸收了更多私人數據和第三方數據的專家Agent,在實用性方面確實大有提升,尤其在面對復雜任務過程中易出錯的問題,它總是能自主發現錯誤并不斷嘗試更正。

不過由于涉及的領域確實比較專業,任務耗時也大大增加,類似股票分析的任務往往需要運行幾十分鐘。

以下為具體實測過程。

0產品經驗也能做出完整用戶調研

假如有一個新入行的產品經理,想要設計一個北京地區的戶外活動APP,需要對用戶需求進行調研。

盡管沒有工作經驗,也可以使用簡單描述來生成一份用戶訪談提綱。

圖片

實測不到1分鐘,這個Agent就生成了一份可下載的Markdown文檔,10個問題基本覆蓋了我們想要調研的需求。

然后我們又繼續在輸入框中下達新指令:

再幫我生成一份調研問卷。

從思考過程可以看到,面對一個比較模糊的需求,它能通過自主規劃(設計約30個問題的調研問卷)進一步明確任務。

圖片

而且評估其生成效果,從一名資深戶外運動愛好者的角度來看,這份調研報告可謂非常完整——

7個大類、30個小問題,從用戶基本信息到戶外運動參與情況、活動信息與獲取等等,均考慮到了。

接下來,鑒于我們目前缺少真實問卷結果,所以又給它扔了個“麻煩”:

能直接幫我生成一份虛擬完整用戶調研數據,并最終生成一份用戶分析報告嗎?

大約幾分鐘后,這個Agent自己生成了一份虛擬用戶數據:

圖片

橫向標準項需要長時間拖動才能看完整,豎向共有100條數據:

當然,過程中Agent也自己發現了錯誤,并多次嘗試更正。

圖片圖片

最終,基于虛擬數據,Agent確實生成了一份可下載的完整用戶畫像報告。

圖片

整體而言,這個用戶研究Agent具備問卷數據分析、訪談紀要總結、調研問卷生成、訪談提綱生成這四大能力,即使零產品經驗也能通過持續對話實現自己的調研需求。

圖片

每天都能收到專屬股票早報

而另一個股票專家Agent,由于涉及的領域比較復雜,官網顯示平均任務耗時為42分鐘

圖片

能做的事兒包括下面這些:

圖片

這里我們簡單測試了其早報生成功能。

支持選定3支關注的股票(這里就不具體展示選了哪些了),以及三個關注的板塊,然后給出當日A股早報。

圖片

有意思的是,相比之前的用戶調研Agent,這個智能體則更加謹慎了,過程中還需要用戶手動確認其階段性完成情況,然后才繼續執行。

圖片

而且整個過程搜集了大量數據:

圖片

不過比較遺憾的是,截至發稿前(已經跑了一個多小時),可能由于服務器資源問題,暫時沒有跑出最終結果。

圖片

圖片

然而,從其他網友對該智能體的測試來看,據稱效果驚艷。

(股票功能)實測蠻驚艷的

圖片

小結一下,相比通用Agent,專家Agent在實用性方面確實更勝一籌。

就產品的初步設計來看,和“扣子空間”這個名字相呼應,扣子團隊希望打造一個“通用Agent和專家Agent協作的系統”。

不過按照扣子團隊的長期設想,最終目標則還是打造一個開放的Agent系統——

當用戶提出需求時,系統能自動調度最合適的一位或多位專家Agent協同完成任務。

而拋開長遠不談,僅就當下這個測試版扣子空間而言,得益于它在自主規劃和任務驅動方面的加強,對于絕大多數實際情況,它已經是一個可以上手、能用的Agent系統了。

One More Thing

這一次,字節在扣子空間上還搞了一波“裂變玩法”。

我們實測過程中發現,在執行完第一個任務之后,還可以得到五個邀請碼。

圖片

并且當五個邀請碼全部用完后,還能獲得更多邀請資格。

所以相比其他家那種完全封閉的測試,扣子空間的體驗資格也更容易獲得。

圖片

最后,有獲得邀請碼的童鞋來說說你的使用體驗嗎?

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-15 13:43:44

AI生成模型

2025-03-07 09:02:00

生成AI視頻

2025-02-26 09:44:14

2025-04-30 14:12:36

Qwen3AgentMCP

2025-05-29 09:07:37

2023-08-24 21:49:54

人工智能高端算法工程師

2024-08-21 13:09:53

2010-09-09 15:21:17

丁磊

2025-04-08 09:15:00

AI論文實測

2013-04-17 10:30:07

GlassGoogle

2009-01-10 10:04:16

Windows 7下載Windows 7 b

2021-11-22 09:30:30

AI 數據人工智能

2019-12-16 14:04:48

MySQL數據庫SQL

2023-11-10 16:08:23

SQL數據庫

2019-10-24 15:23:04

SQL優化數據庫

2020-05-22 08:24:21

SQLMySQL數據庫

2012-08-24 09:25:21

服務器虛擬化刀片服務器

2013-06-26 10:25:45

人民大學服務器癱瘓流量

2020-02-10 13:22:35

編程語言機器學習Python
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩欧美精品一区 | 国产一伦一伦一伦 | 日韩精品一区二区三区高清免费 | 日日日色 | 激情av网站 | 欧美精品a∨在线观看不卡 国产精品久久国产精品 | 午夜影院| 久久精品一区 | 午夜在线视频 | 亚洲精久| 97色综合| 中文字幕精品一区二区三区精品 | 午夜欧美 | 福利久久| 中文字幕高清 | 精品美女 | 亚州精品天堂中文字幕 | 日韩一区二区三区在线 | 国产精品免费观看 | www亚洲一区 | 国产免费拔擦拔擦8x高清 | 亚洲福利一区二区 | 国产乱码精品一区二区三区中文 | 日本超碰在线 | 亚洲一区二区三区视频 | 国产农村妇女精品一二区 | 日韩中文字幕免费 | 亚洲一区二区三区在线播放 | 午夜资源 | 亚洲大片一区 | 国产精品18久久久久久白浆动漫 | 国产精品一区在线观看你懂的 | 久久99精品视频 | aaaaaa大片免费看最大的 | 国产欧美日韩一区 | 精品电影 | www.日本三级| 色播视频在线观看 | 欧美高清视频在线观看 | 成人亚洲在线 | 毛片免费在线 |