成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大語言模型做數(shù)據(jù)助手,浙大Data-Copilot高效調(diào)用、處理、可視化數(shù)據(jù)

人工智能 新聞
在通用數(shù)據(jù)的背景下,LLMs 能否構(gòu)建自動(dòng)化的數(shù)據(jù)科學(xué)工作流來處理各種與數(shù)據(jù)相關(guān)的任務(wù)?

金融、氣象、能源等各行各業(yè)每天都會(huì)生成大量的異構(gòu)數(shù)據(jù)。人們急切需要一個(gè)工具來有效地管理、處理和展示這些數(shù)據(jù)。

近日,浙江大學(xué)提出 DataCopilot,通過部署大語言模型 (LLMs) 來自主地管理和處理海量數(shù)據(jù),即它連接不同領(lǐng)域的豐富數(shù)據(jù),滿足多樣化的用戶查詢,計(jì)算,預(yù)測,可視化等需求。

圖片

Repo: https://github.com/zwq2018/Data-Copilot 

Arxiv: https://arxiv.org/abs/2306.07209

Demo: https://huggingface.co/spaces/zwq2018/Data-Copilot

只需要輸入文字告訴 DataCopilot 你想看啥數(shù)據(jù),無需繁瑣的操作,無需自己編寫代碼,DataCopilot 自主地將原始數(shù)據(jù)轉(zhuǎn)化為最符合用戶意圖的可視化結(jié)果,因?yàn)樗梢宰灾鞯貛湍阏覕?shù)據(jù),處理數(shù)據(jù),分析數(shù)據(jù),畫圖,無需人類協(xié)助。

圖片圖片

許多研究已經(jīng)探索了 LLMs 的潛力。例如 Sheet-Copilot、Visual ChatGPT、Audio GPT 利用 LLMs 調(diào)用視覺,語音等領(lǐng)域工具進(jìn)行數(shù)據(jù)分析、視頻編輯和語音轉(zhuǎn)換。從數(shù)據(jù)科學(xué)的角度來看,表格、可視化和音頻都可以被視為一種形式的數(shù)據(jù),所有這些任務(wù)都可以被看作是與數(shù)據(jù)相關(guān)的任務(wù)。因此,一個(gè)新的問題出現(xiàn)了:在通用數(shù)據(jù)的背景下,LLMs 能否構(gòu)建自動(dòng)化的數(shù)據(jù)科學(xué)工作流來處理各種與數(shù)據(jù)相關(guān)的任務(wù)?為了實(shí)現(xiàn)這一目標(biāo),需要解決幾個(gè)挑戰(zhàn):

  • 從數(shù)據(jù)角度看:直接使用 LLMs 讀取和處理海量數(shù)據(jù)不僅不切實(shí)際,而且存在數(shù)據(jù)泄露的潛在風(fēng)險(xiǎn)。
  • 從模型角度看:LLMs 不擅長處理數(shù)值計(jì)算,可能沒有合適的可調(diào)用外部工具來滿足多樣化的用戶需求,從而限制了 LLMs 的利用率。
  • 從任務(wù)角度看:盡管 LLMs 展示了強(qiáng)大的少樣本能力,但許多與數(shù)據(jù)相關(guān)的任務(wù)是復(fù)雜的,需要結(jié)合多個(gè)操作,如數(shù)據(jù)檢索、計(jì)算和表格操作,并且結(jié)果需要以圖像、表格和文本等多種格式呈現(xiàn),這些都超出了當(dāng)前 LLMs 的能力。

因此,為了實(shí)現(xiàn)的囊括數(shù)據(jù)相關(guān)任務(wù)的通用框架,研究提出 Data-Copilot:

圖片圖片

Data-Copilot 是一個(gè)基于 LLM 的系統(tǒng),用于處理與數(shù)據(jù)相關(guān)的任務(wù),連接了數(shù)十億條數(shù)據(jù)和多樣化的用戶需求。它獨(dú)立設(shè)計(jì)接口工具,以高效地管理、調(diào)用、處理和可視化數(shù)據(jù)。在接收到復(fù)雜請求時(shí),Data-Copilot 會(huì)自主調(diào)用這些自設(shè)計(jì)的接口,構(gòu)建一個(gè)工作流程來滿足用戶的意圖。在沒有人類協(xié)助的情況下,它能夠熟練地將來自不同來源、不同格式的原始數(shù)據(jù)轉(zhuǎn)化為人性化的輸出,如圖形、表格和文本。

主要貢獻(xiàn)

  • 設(shè)計(jì)了一個(gè)通用的處理數(shù)據(jù)相關(guān)數(shù)據(jù)的智能系統(tǒng),將不同領(lǐng)域的數(shù)據(jù)源和多樣化的用戶需求連接起來,通過將 LLM 集成到整個(gè)流程中,減少了繁瑣的勞動(dòng)和專業(yè)知識(shí)。
  • Data-Copilot 實(shí)現(xiàn)自主管理、處理、分析、預(yù)測和可視化數(shù)據(jù)。當(dāng)接收到請求時(shí),它將原始數(shù)據(jù)轉(zhuǎn)化為最符合用戶意圖的信息性結(jié)果。
  • Data-Copilot 作為設(shè)計(jì)者和調(diào)度者,包括兩個(gè)過程:接口工具的設(shè)計(jì)過程 (設(shè)計(jì)者) 和接口工具的調(diào)度過程 (調(diào)度者)。
  • 基于中國金融市場數(shù)據(jù)構(gòu)建了 Data-Copilot Demo。

主要方法

Data-Copilot 是一個(gè)通用的大語言模型系統(tǒng),具有接口設(shè)計(jì)和接口調(diào)度兩個(gè)主要階段。

  • 接口設(shè)計(jì):研究設(shè)計(jì)了一個(gè) self-request 的過程,使 LLM 能夠自主地從少量種子請求生成足夠的請求。然后,LLM 根據(jù)生成的請求進(jìn)行迭代式的設(shè)計(jì)和優(yōu)化接口。這些接口使用自然語言描述,使它們易于擴(kuò)展和在不同平臺(tái)之間轉(zhuǎn)移。
  • 接口調(diào)度:在接收到用戶請求后,LLM 根據(jù)自設(shè)計(jì)的接口描述和 in context demonstration 來規(guī)劃和調(diào)用接口工具,部署一個(gè)滿足用戶需求的工作流,并以多種形式呈現(xiàn)結(jié)果給用戶。

Data-Copilot 通過自動(dòng)生成請求和自主設(shè)計(jì)接口的方式,實(shí)現(xiàn)了高度自動(dòng)化的數(shù)據(jù)處理和可視化,滿足用戶的需求并以多種形式向用戶展示結(jié)果。

圖片圖片

接口設(shè)計(jì)

如上圖所示,首先要實(shí)現(xiàn)數(shù)據(jù)管理,第一步需要接口工具。

Data-Copilot 會(huì)自己設(shè)計(jì)了大量接口作為數(shù)據(jù)管理的工具,其中接口是由自然語言(功能描述)和代碼(實(shí)現(xiàn))組成的模塊,負(fù)責(zé)數(shù)據(jù)獲取、處理等任務(wù)。

  • 首先,LLM 通過少量的種子請求并自主生成大量請求 (explore data by self-request), 盡可能覆蓋各種應(yīng)用場景。
  • 然后,LLM 為這些請求設(shè)計(jì)相應(yīng)的接口(interface definition: 只包括描述和參數(shù)),并在每次迭代中逐步優(yōu)化接口設(shè)計(jì) (interface merge)。 
  • 最后,研究利用 LLM 強(qiáng)大的代碼生成能力為接口庫中的每個(gè)接口生成具體的代碼 (interface implementation)。這個(gè)過程將接口的設(shè)計(jì)與具體的實(shí)現(xiàn)分離開來,創(chuàng)建了一套多功能的接口工具,可以滿足大多數(shù)請求。

如下圖:Data-Copilot 自己設(shè)計(jì)的接口工具用于數(shù)據(jù)處理:

圖片圖片

接口調(diào)度

在前一個(gè)階段,研究獲取了用于數(shù)據(jù)獲取、處理和可視化的各種通用接口工具。每個(gè)接口都有清晰明確的功能描述。如上圖所示的兩個(gè)查詢請問,Data-Copilot 通過實(shí)時(shí)請求中的規(guī)劃和調(diào)用不同的接口,形成了從數(shù)據(jù)到多種形式結(jié)果的工作流程。

  • Data-Copilot 首先進(jìn)行意圖分析來準(zhǔn)確理解用戶的請求。
  • 一旦準(zhǔn)確理解了用戶的意圖,Data-Copilot 將規(guī)劃一個(gè)合理的工作流程來處理用戶的請求。Data-Copilot 會(huì)生成一個(gè)固定格式的 JSON,代表調(diào)度的每個(gè)步驟,例如 step={"arg":"","function":"", "output":"","description":""}。

在接口描述和示例的指導(dǎo)下,Data-Copilot 在每個(gè)步驟內(nèi)以順序或并行的方式精心安排接口的調(diào)度。

如下圖例子:

圖片

Data-Copilot 自主設(shè)計(jì)了工作流如下:

圖片圖片

針對這個(gè)復(fù)雜的問題,Data-Copilot 采用了 loop_rank 這個(gè)接口來實(shí)現(xiàn)多次循環(huán)查詢。

最后該工作流并執(zhí)行后結(jié)果如下:

圖片圖片

橫坐標(biāo)是每只成分股的股名,縱坐標(biāo)是一季度的凈利潤同比增長率

實(shí)驗(yàn)結(jié)果

預(yù)測工作流

圖片圖片

部署工作流:獲取歷史 GDP 數(shù)據(jù) ----> 采用線性回歸模型預(yù)測未來 -----> 輸出表格

圖片圖片

圖片

并行工作流

圖片圖片

圖片圖片

圖片圖片

結(jié)論

研究提出了一個(gè)通用的框架,Data-Copilot,用于處理各種數(shù)據(jù)相關(guān)任務(wù)。它作為連接眾多異構(gòu)數(shù)據(jù)和人類之間的橋梁,根據(jù)人類的喜好有效地管理、處理和展示數(shù)據(jù)。Data-Copilot 通過將 LLMs 整合到數(shù)據(jù)相關(guān)任務(wù)的每個(gè)階段中,根據(jù)用戶的請求將原始數(shù)據(jù)自動(dòng)轉(zhuǎn)化為用戶友好的可視化結(jié)果,顯著減少了對繁瑣勞動(dòng)和專業(yè)知識(shí)的依賴。 

像一位經(jīng)驗(yàn)豐富的專家一樣,Data-Copilot 自主設(shè)計(jì)了適用于各種類型數(shù)據(jù)和潛在用戶需求的通用接口工具,并在實(shí)時(shí)響應(yīng)中調(diào)用這些接口,為用戶請求部署清晰的工作流程。接口設(shè)計(jì)和調(diào)度這兩個(gè)過程完全由 Data-Copilot 控制,幾乎不需要人的干預(yù)。

研究提供了一個(gè)中國金融版的 Data-Copilot, 它可以靈活處理與股、基金、經(jīng)濟(jì)、公司財(cái)務(wù)和實(shí)時(shí)新聞等方面的復(fù)雜請求,是一個(gè)可靠的人工智能助手。

責(zé)任編輯:張燕妮 來源: PaperWeekly
相關(guān)推薦

2020-03-11 14:39:26

數(shù)據(jù)可視化地圖可視化地理信息

2017-10-14 13:54:26

數(shù)據(jù)可視化數(shù)據(jù)信息可視化

2023-12-27 10:47:45

Flask數(shù)據(jù)可視化開發(fā)

2024-04-11 11:35:03

大語言模型LLMs

2021-09-26 16:20:04

Sentry Dashboards 數(shù)據(jù)可視化

2015-03-16 14:00:25

大數(shù)據(jù)誤區(qū)大數(shù)據(jù)可視化大數(shù)據(jù)

2018-08-09 22:16:35

可視化數(shù)據(jù)集Groeger

2022-07-05 15:11:42

Python數(shù)據(jù)可視化機(jī)器學(xué)習(xí)

2015-08-20 10:00:45

可視化

2018-05-21 07:54:44

數(shù)據(jù)可視化大數(shù)據(jù)數(shù)據(jù)

2017-02-09 10:31:17

大數(shù)據(jù)可視化誤區(qū)

2017-12-21 11:08:18

2025-02-17 08:05:00

數(shù)據(jù)可視化微軟AI

2014-05-28 15:23:55

Rave

2017-02-23 09:42:53

大數(shù)據(jù)數(shù)據(jù)可視化技術(shù)誤區(qū)

2023-05-08 16:29:34

2017-06-19 08:30:35

大數(shù)據(jù)數(shù)據(jù)可視化報(bào)表

2020-12-22 14:14:25

大數(shù)據(jù)數(shù)據(jù)可視化

2020-05-26 11:34:46

可視化WordCloud

2022-02-23 09:50:52

PythonEchartspyecharts
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 成人超碰 | 一区二区三区日韩 | 亚洲精品一区二区三区在线 | 台湾a级理论片在线观看 | 亚洲精品国产第一综合99久久 | 国产精品一区二区av | 日韩在线中文字幕 | 国产精品美女久久久久久免费 | 伊人天堂网 | 91精品www | 天天操一操 | 91porn成人精品| gav成人免费播放视频 | 国产三级一区二区三区 | 成人在线免费观看 | 日韩成人影院 | 午夜精品一区 | 欧美一级大片免费观看 | 影音先锋中文在线 | 国产偷录视频叫床高潮对白 | av国产精品毛片一区二区小说 | 日本精品在线播放 | 一区二区视频在线观看 | 日韩免费成人av | 欧美精品国产精品 | 国内精品99| 色视频网站 | 精品国产一区二区在线 | 日中文字幕在线 | 久久一级 | 久久精品国产清自在天天线 | 国产91在线 | 中日 | 午夜欧美| 日韩免费av网站 | 国产精品久久久久久吹潮 | 91网视频| 狠狠热视频 | 欧美一级三级 | 亚洲有码转帖 | 一区二区欧美在线 | 亚洲视频在线看 |