成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

斯坦福開源學術(shù)研究神器STORM再進化,AI智能體像人一樣進行圓桌討論

人工智能 新聞
STORM 在 LLM 的協(xié)助下,通過檢索、多角度提問和模擬專家對話等方式,在整理收集到的信息基礎(chǔ)上生成寫作大綱,并最終形成一份詳細、深入和準確的內(nèi)容報告。

今年 4 月,斯坦福大學推出了一款利用大語言模型(LLM)輔助編寫類維基百科文章的神器。它就是開源的 STORM,可以在三分鐘左右將你輸入的主題轉(zhuǎn)換為長篇文章或者研究論文,并能夠以 PDF 格式直接下載。

具體來講,STORM 在 LLM 的協(xié)助下,通過檢索、多角度提問和模擬專家對話等方式,在整理收集到的信息基礎(chǔ)上生成寫作大綱,并最終形成一份詳細、深入和準確的內(nèi)容報告。STORM 尤其擅長需要大量研究和引用的寫作任務。更難得的是,用戶可以直接在 STORM 的網(wǎng)站免費體驗。

此后,STORM 不斷推出新的功能和服務,在 GitHub 上的 Star 量已經(jīng)超過了 12k。

圖片

GitHub 地址:https://github.com/stanford-oval/storm

就在最近,該團隊又推出全新功能 ——Co-STORM。與 STORM 的區(qū)別在于,它引入了協(xié)作對話機制,并采用輪次管理策略,實現(xiàn)流暢的協(xié)作式 AI 學術(shù)研究。功能包括如下:

Co-STORM LLM 專家:這種類型的智能體會根據(jù)外部知識來源生成答案并能根據(jù)對話歷史提出后續(xù)問題。

主持人(Moderator):該智能體會根據(jù)檢索器發(fā)現(xiàn)但未在前幾輪直接使用的信息生成發(fā)人深省的問題。當然,問題生成也可以基于事實。

人類用戶:人類用戶將主動觀察對話以更深入地了解主題,或者通過注入對話來引導討論焦點,積極參與對話。

Co-STORM 的界面是下面這樣的。

圖片

體驗地址:https://storm.genie.stanford.edu/

我們讓 Co-STORM 就戰(zhàn)爭與和平(war and peace)主題來生成一篇文章,大約需要三分鐘。

圖片

在生成文章之后,我們可以看到,主持人提出問題,并得到基本信息提供者、文學教授、紀錄片導演等不同 AI 智能體的回復,然后開啟新一輪次的提問。

圖片

此外,Co-STORM 的相關(guān)論文已被 EMNLP 2024 主會議收錄。

圖片

論文地址:https://www.arxiv.org/pdf/2408.15232

運行原理概覽

下圖為 Co-STORM 框架。整體而言,Co-STORM 模擬用戶、觀點引導專家和主持人之間的協(xié)作對話。

運行原理如下所示:首先維護動態(tài)更新的思維導圖(3.2),從而幫助用戶跟蹤和參與對話(3.3)。 

在 3.4,提示模擬專家根據(jù)對話歷史來確定對話意圖,并生成基于互聯(lián)網(wǎng)的問題或答案。

在 3.5,提示模擬主持人利用未使用的信息和思維導圖生成新問題,從而自動引導對話。

最后,思維導圖可用來生成完整的引用報告以作為總結(jié)。

圖片

評估結(jié)果

自動評估可以實現(xiàn)可擴展測試,并允許對用戶行為進行一致的模擬。

研究者將 Co-STORM 與以下基線進行比較:(1)RAG Chatbot,該基線從搜索引擎檢索信息并通過一問一答范式與用戶交互;(2)STORM + QA,該基線使用 STORM 框架為給定主題生成報告以提供基本信息。

下表 3 展示了報告質(zhì)量和對話中問答輪次質(zhì)量的評估結(jié)果。問答輪次和最終報告是人類與 Co-STORM 交互時學習的主要來源。STORM + QA 在研究給定主題時考慮了多種觀點,與 RAG Chatbot 相比,確實提高了報告質(zhì)量所有四個評分維度的表現(xiàn)。

同樣,Co-STORM 的表現(xiàn)優(yōu)于 RAG Chatbot,特別是在深度和新穎性方面,它通過模擬具有多個智能體角色的協(xié)作對話,類似于圓桌討論。就對話質(zhì)量而言,Co-STORM 中的問答輪次在一致性和參與度方面明顯優(yōu)于兩個基線。

圖片

Co-STORM 的一個關(guān)鍵特性是 LM 智能體可以代表用戶提問。如下圖 3 所示,在檢查提問輪次時,Co-STORM 多智能體設計的優(yōu)勢變得更加明顯,只需要一位專家和一位主持人就可以極大地獲益。

重要的是,CoSTORM 中的主持人角色會根據(jù)有關(guān)主題的未使用信息提出問題。這樣的角色代表擁有更多已知未知(known unknowns)的人,有效地引導對話,幫助用戶在未知未知(unknown unknowns)空間中發(fā)現(xiàn)更多信息。

圖片

下表 4 為人工評分結(jié)果,圖 4 為成對比較結(jié)果。可以得出結(jié)論,CoSTORM 可以幫助用戶找到與其目標相關(guān)的更廣泛、更深層次的信息。

圖片

圖片

更多技術(shù)細節(jié)和評估結(jié)果請參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2023-08-10 14:01:08

開源虛擬

2023-07-07 17:03:23

AI智能

2022-02-24 13:59:59

AI智能體研究

2017-11-28 14:18:29

2024-07-22 08:00:00

機器人虛擬

2019-12-16 14:33:01

AI人工智能斯坦福

2024-05-06 07:10:00

李飛飛智能空間

2020-09-30 17:12:09

人工智能技術(shù)數(shù)據(jù)

2018-06-28 22:04:25

智能體華為云人工智能

2019-03-27 10:47:05

人工智能法律AI

2025-01-17 10:26:19

模型開發(fā)ChatGPT

2025-06-13 09:10:00

2021-12-20 16:23:40

AI 數(shù)據(jù)人工智能

2021-10-13 09:38:13

人工智能機器學習技術(shù)

2025-01-03 10:55:22

2023-02-20 15:20:58

斯坦福論文

2025-02-24 10:07:04

2018-12-14 11:48:24

AI人工智能機器人
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 精品国产伦一区二区三区观看说明 | 91视频导航 | 国产福利在线播放麻豆 | 欧美在线一区二区视频 | 久久久久久久av | 精品久久久久久久 | 免费久久久| 97国产精品视频人人做人人爱 | 国产欧美在线播放 | 日韩久久久久久久 | 国产毛片久久久久久久久春天 | 99综合网 | 日韩精品视频在线免费观看 | 日韩久草 | 天天操天天摸天天干 | 视频一区在线观看 | 亚洲午夜精品 | 亚洲一区二区三区在线 | 色欧美片视频在线观看 | 日日天天 | 欧美综合一区二区三区 | 欧美一级免费看 | 91久久久久久久久久久 | 日韩欧美在线视频 | 91在线视频一区 | 成人二区| 久久精品中文字幕 | 蜜桃精品噜噜噜成人av | 99爱视频 | 成人国产在线视频 | 一区二区三区国产 | 欧美激情免费在线 | 免费成人毛片 | 日日欧美 | 亚洲综合视频一区 | 亚洲精品乱码久久久久久蜜桃91 | www久久99| 国产乱码精品一区二区三区五月婷 | 日日骚视频 | 日韩人体视频 | 亚洲高清在线观看 |