成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

阿里巴巴數據消費場景AI Agent實踐

人工智能
隨著 AI 技術的持續發展,如何將其應用于數據消費場景中是備受關注的一個問題。本文將介紹阿里云智能集團瓴羊智能科技 AI Agent 資深產品專家葉筆長在 DA 數智大會上的分享——對AI驅動下的數據消費的認知,以及在該方向上的探索與實踐。

一、阿里瓴羊公司介紹

首先簡單介紹阿里瓴羊公司。

1. 瓴羊介紹

圖片

瓴羊是阿里巴巴全資子公司,主營數據要素服務。瓴羊提供一整套數字化產品和服務,涵蓋數據加工、數據消費以及數據流通等三大環節。幫助企業有效利用數據資源,促進數據與企業實際經營的深度融合,賦能企業增長和數字化轉型。

瓴羊已服務了上百家知名企業和眾多中小企業的數字化建設,如一汽紅旗、星巴克、自然堂、極氪、喬丹、中國移動和中海油等,覆蓋零售、汽車與制造、互聯網、金融等多個行業。

圖片

隨著企業的發展,數據不斷累積,導致管理難度增加。更加嚴重的是,隨著企業業務的渠道在變多,平臺在變多,相應的 IT 系統和企服產品也在變多。企業組織內過多的產品和系統,以及這些產品和系統所產生的各自為戰、零散不統一的數據。

瓴羊公司的前身是阿里巴巴內部最懂數據的團隊——數據中臺,也曾經被叫做 DT 團隊(Data Technology)。基于「One Data」方法論,不斷演進出 One Product、One Platform,直至 2021 年成立瓴羊公司。從服務于集團內部,發展到服務于成百上千的外部客戶,幫助各行業企業解決數據相關問題。

2. 瓴羊公司在數據領域構建的產品

圖片

瓴羊在數據領域打造了兩大產品:

第一個是 Dataphin 智能數據建設與治理,旨在解決企業數據建設、數據采集、數據資產管理等一系列數據治理問題。針對各行業大數據建設、治理及應用訴求,結合數據中臺方法論,一站式提供全域數據集成、可視建模及規范定義、數據資產治理等能力,助力企業打造標準統一、準確可信、便捷可消費的數據體系。

第二個是 Quick BI 智能商業分析,主要解決數據生產出來后如何服務于企業決策場景和各種分析應用場景。Quick BI 是首個且唯一入選 Gartner 商業智能和分析平臺魔力象限報告(《Magic Quadrant for Analytics and Business Intelligence Platforms》)的中國企業產品,截至今年已經連續 5 年進入 Gartner 魔力象限,特別是最近兩年都進入了挑戰者象限。

這兩大產品是我們服務于客戶的核心載體。接下來將圍繞這兩個產品在 AI 方向上的實踐展開介紹。

二、AI 驅動下的數據消費

1. 數據消費的三個主要方面

圖片

瓴羊服務的客戶非常多,有制造業、零售業等各種各樣的客戶,這些客戶的內部流程和業務場景千差萬別。在 DA 數智大會現場,葉筆長舉了一個具象化的例子:如果企業是一個人,那么算法、算力、數據就對應智力、體力和血液,數據會流經企業中的各個環節,因此其發揮作用的場景非常多。

葉筆長指出,在面對復雜多變的業務場景時,數據消費的核心問題主要集中在以下三個方面:

(1)問數:企業在決策分析的時候,能不能問到數據?

(2)找數:業務分析師和產品工程師能不能在海量的數據資產中快速找到真正想要的數據表?

(3)看數:數據的可視化是企業中最基礎的需求,也是傳統 BI 一直在解決的問題。

葉筆長認為,隨著 AI 技術的不斷進步和業務場景的持續演變,要充分發揮 AI 的獨特價值,關鍵在于以下兩點:

(1)數據資產建設:企業內的數據相關部門或團隊需要構建清晰且易于使用的數據資產。在上一輪的數據革命中,阿里巴巴主要解決的就是通過打造數據中臺統一數據,并保證數據高質量的問題。

(2)角色賦能與數據利用:一旦數據資產建立起來,接下來的重點是如何讓企業中的各個角色,尤其是那些與數據緊密相關的角色,發揮出其最大的價值。每個角色在服務用戶時所需的數據及其使用方式各不相同。瓴羊的策略是為這些角色提供一個名為 Data Agent 的數據平臺,在這個平臺上,他們可以根據自身的需求和場景快速創建定制化的數據代理(Agent)。這不僅有助于將特定角色的知識和經驗沉淀下來,還為未來構建大規模的企業內部AI代理市場奠定了基礎。

而言之一句話:資產建設要做好,數字分身共打造。

2. 企業進行數據分析的典型框架

圖片

現場,葉筆長展示了一個企業內數據分析服務的典型框架:在目標方向清晰的情況下,經過自上而下的拆解,能夠拆解出一套企業內的分析體系、報表體系。這個體系能夠讓企業內各個角色聯動起來,形成一個目標統一的體系。

3.數據分析的典型問題與挑戰

然而,上述解決方案還存在一個重大的問題。在這套確定性的看數和問數模式下,缺失了很多靈活性,比如臨時性、探查性和分析性的問題。AI 的出現給了我們一種新的契機去解決這類問題。

圖片

在原來的確定性體系下,業務人員或數據分析人員今天要臨時取這個數據,明天要分析那個數據,時間都花費在取數上。如果提交給業務產品開發,就需要排版本,需求可能一直排在后面,要不斷地等待。

傳統 BI 解決這個問題的方式是構建一些自定義的卡片,來支持靈活報表和靈活分析。但是在新的 AI 技術條件下,有一種新的解決方案,就是用自然語言去表達業務訴求,解放企業的數據人員,從而發揮數據人員向上的邏輯和業務人員向下的邏輯,讓雙方需求更好地 mapping 起來。

三、智能分析

1. 瓴羊智能商業分析產品 Quick BI

瓴羊智能商業分析產品 Quick BI 正是為了解決企業中看數的問題,特別是針對確定性問題之外的那些靈活看數需求。

圖片

葉筆長在現場演示了一段真實場景操作視頻,在 Quick BI 的基礎功能之上,融合了先進的大模型技術,對 AI 助手智能小 Q 進行了升級,旨在有效解決企業在日常數據查看與查詢中遇到的難題。

智能小 Q 可以幫助用戶通過智能搭建快速生成整張報表,或者指定報表快速呈現數據結果。在搭建過程中,無需尋找隱藏在頁面深處的功能點和配置項,只需簡單輸入即可完成復雜配置。無需設計師幫助,也能打造專業美觀的視覺效果。

通過智能小 Q,用戶可以隨時隨地以對話方式問數。只需要上傳企業知識,智能小 Q 就能學習到業務邏輯。通過對話輸入,數據即可一覽無余。如果對數據準確性有顧慮,還可以查看 AI 取數過程。支持多輪對話、追問下鉆即可獲取詳細指標,拆解波動原因,歸納關鍵貢獻因素。分析數據規律,預測未來走勢等等。

隨著大模型的引入,Quick BI 更加智能,業務人員可以更簡便地查詢分析數據,降低了操作門檻,也減少了分析師簡單重復的勞動,使其可以專注于更有價值的工作。企業可以借助越來越智能化的 Quick BI 去應對不斷膨脹的業務數據和復雜分析。目前 Quick BI 已經服務于各類行業,助力銷售、金融、制造等行業客戶實現數據智能分析,不斷提升企業數字化水平,推動了數據消費新范式。

2. 大模型的兩個重要認知

在 BI 應用這個方向上,應該如何選擇模型?立足 Quick BI 智能小 Q 的研發歷程,總結出以下兩點重要認知:

首先,模型越大、參數越多,則效果越好。但是這同時意味著對資源的要求越高,即對算力卡、內存,以至于整個機器的成本更高。葉筆長建議需要在這兩者之間找到一個平衡點。

另外,數據是解鎖智能的關鍵鑰匙,數據質量決定了模型的效果。更多的預訓練數據和更高質量的標注數據可以顯著降低模型大小,提升模型性能。

圖片

葉筆長介紹到,由于瓴羊的客戶覆蓋了廣泛的行業領域,因此在模型部署上采取了兩種方式:

一種是公有云模式,用戶只需訂閱服務即可使用;另一種則是針對那些出于數據安全考慮而偏好私有化部署的客戶。為了同時滿足這兩類客戶的需求,不僅要在客戶的軟件、硬件設施以及網絡環境等多方面作出適應性調整,還要確保模型能夠達到基本的性能標準。為此,團隊對從 7B 到 72B 不同規模的模型進行了全面測試。

此外,為了避免數據分析過程中可能出現的信息誤導(所謂“幻覺”),持續地對模型進行微調變得尤為重要。特別是在數據分析的應用場景下,準確地識別排名、趨勢及分布等關鍵指標,對于提供可靠的數據洞察來說至關重要。

3. 產品的技術架構

下面分享模型選擇后如何構建產品技術架構。

圖片

在智能問數場景,如果用戶輸入的是自然語言,那么從自然語言到具體的指令需要做一些中間轉換。不同的廠商對此有不同的處理方式,而 Quick BI 智能小 Q 則支持多種轉換路徑,包括 NL2API、NL2DSL 以及 NL2SQL。

由于瓴羊產品內置的 AI Agent 允許用戶自定義并快速編排功能,使得其應用場景非常廣泛且復雜。在具體應用中:

(1)對于那些明確且固定的場景,采用 NL2API 的方式最為高效和準確,因為它能直接從用戶的自然語言映射到最終的操作指令。

(2)瓴羊產品的發展歷程并非從零開始,它需要兼容內部已有的多種歷史產品和技術體系,同時也要適應外部客戶多樣性的需求,因此開發了 NL2DSL 技術。通過創建一套獨特的 DSL(領域特定語言),實現了更靈活高效的轉換機制。

(3)鑒于每種數據庫都有其獨特的 SQL 語法方言,單獨適配每一種數據庫的成本極高。為此,Quick BI 團隊特別訓練了一個大型模型解決 DSL2SQL,極大地降低了適配成本。

此外,Quick BI 還對可視化展示與復雜計算能力進行了大量針對性優化,構建了一套強大的 BI 基礎引擎。這套系統不僅能夠很好地處理復雜的 SQL 查詢,還能通過高級的應用渲染組件顯著增強數據可視化效果。

圖片

基于通義千問這一強大的基礎模型,Quick BI 成功構建了專為數據分析領域優化的大規模模型。在此過程中,特別關注了數據質量、多任務協同以及模型泛化這三個關鍵要素。

(1)高質量的數據:首先,高質量的數據意味著多樣性。如果僅使用單一類型的數據進行訓練,那么模型的學習能力將受到限制,只能針對某一類問題提供解決方案。為此,Quick BI 團隊向大模型提供了豐富多樣化的樣本以支持微調與預訓練過程,確保其能夠處理更廣泛的應用場景。此外,保持數據的一致性同樣重要,這有助于避免因輸入信息不一致而導致的預測結果不穩定。

(2)多任務間的協調:在模型訓練階段,合理配置不同類型的任務比例對于提升最終模型性能至關重要。通過精心設計不同任務之間的相互作用關系,可以使模型在面對實際問題時更加靈活地選擇合適的解決策略。

(3)逐步提高難度:為了增強模型的泛化能力,在訓練過程中采取循序漸進的方式增加挑戰性是非常有效的做法。這種方法可以幫助模型更好地適應未曾見過的新情況,從而提高其整體表現力和應用范圍。

通過上述措施,Quick BI 不僅提高了自身產品的技術水平,也為用戶帶來了更加高效準確的數據分析體驗。

圖片

瓴羊對各種復雜 SQL 進行了抽象。比如時間算子,做了單獨的訓練和加強,能夠準確理解用戶指令,將各類關于時間的表達精準映射到具體的數據庫 SQL 指令。

4. 案例分享

分享過程中,葉筆長現場還展示了一個企業使用實例。

Step1:需求背景

某企業在制定銷售激勵活動時,需要對其銷售明細數據進行深入的探查與分析,以確定具體的激勵政策方案。這包括對銷售金額的拆分、排名等一系列復雜的操作,旨在通過精細化的數據分析來優化激勵機制,提高銷售團隊的積極性和效率。

Step2:分析挑戰

在這一過程中,由于涉及到大量的數據分析工作,如根據銷售金額進行拆分,并基于這些細分后的數據進一步做排名等,采用傳統方法往往意味著企業必須向 IT 部門提出具體的需求,由專業工程師開發相應的解決方案。這種方式不僅耗時較長,而且靈活性較差,難以迅速響應市場變化或內部策略調整的需求。

Step3:解決方案

(1)快速搭建能力:提供一個能夠快速構建分析模型的平臺,使非技術人員也能輕松地獲取所需的信息,例如各區域內的銷售業績前三名。

(2)智能呈現方式:系統能夠自動識別數據特征并選擇最合適的展示形式。對于包含地理位置信息的數據集,平臺會自動生成地圖視圖,直觀展現不同地區的銷售情況。

(3)靈活鉆取與自定義分析:除了直接回答用戶提出的特定問題(如浙江省的銷售表現),該解決方案還能自動擴展分析范圍至全國各省,并允許用戶自由選取感興趣的維度深入探索。此外,整個分析過程透明化,用戶可以查看從原始數據到最終結論之間的每一步驟,增強了結果的可信度與可解釋性。

圖片

四、智能找數

除了智能分析方向的產品,葉筆長還分享了 AI 在大數據領域另一應用方向——智能找數。

1. Dataphin 產品實踐介紹

圖片

企業中的數據量一般會有萬級甚至十萬、百萬級,這些大規模的數據每天都在不斷地迭代更新,要從中快速找到真正需要的表就構成了一個巨大的挑戰。

瓴羊的 Dataphin·DataAgent 有兩個核心能力:「快速找表」和「快速構建私有化DataAgent」能力。

DataAgent 是基于已準備好的數據資產(包括但不限于表格、指標、標簽和數據 API 等),通過 Dataphin 快速編排而形成的智能化工具。它支持權限管理,能夠針對不同業務部門實施訪問控制。借助阿里巴巴成熟的數據資產管理經驗,企業可以創建專門的工作空間來構建各部門的知識庫,并根據這些知識庫實現跨用戶群及部門間的權限隔離。與 Quick BI 提供的大模型解決方案不同,Dataphin 允許用戶靈活配置多種類型的大規模模型,以滿足不同企業和個人用戶的特定需求。

對于企業管理者來說,最大化利用企業數據資產的價值至關重要;而對于數據開發者而言,則需要提高處理眾多請求時的工作效率;數據分析師面對海量信息時,需尋找更高效的方法來檢索相關資料;此外,減少業務人員獲取數據過程中的等待時間和溝通成本也是亟待解決的問題。

Dataphin·DataAgent 為每位數據工作者提供了一個專屬的數據智能助手。該平臺集中管理來自多個源頭的數據資源,采用主題式的目錄結構進行組織,并賦予每項數據豐富的多維度屬性,從而實現了從原始數據到有價值資產的轉變。通過構建向量數據庫并結合流程設計,用戶可以輕松創建個性化的智能助手,開啟智能化對話服務。

例如,官方推出的智能助手小 D 可以根據具體的商業目標提出建議,并給出分析框架。此外,它還能深入剖析復雜問題,識別出重要的數據資產元素,幫助用戶精準定位所需信息。同時,這款工具還提供了查看數據間的關聯性以及生成報告的功能,使得從需求分析到報表制作整個流程變得更加簡單快捷。另外,當有特定的數據提取需求時,它也能輔助生成相應的查詢代碼,展示結果,并支持可視化數據分析,進而高效地完成高質量的數據分析報告,助力企業更好地挖掘其數據資產潛力。

用戶還可以自行開發定制化的智能應用,并一鍵部署上線,以便更加有效地服務于具體業務場景,激發新的增長點。

2. 通過應用 AI 技術,在數據資產發現方面帶來的變化

圖片

過去,企業數據分析師通常是通過關鍵詞在數據資產中進行搜索。而現在,分析師或運營專員可以完整地表達自己的思路,DataAgent 能夠自動解析這一分析框架,識別出其中涉及的數據資產。隨后,系統會智能匹配并推薦最適合的分析內容。

五、小結

以上就是對智能分析和智能找數兩大產品的介紹。

在真實業務場景中,智能找數和智能問數并非孤立存在的,兩者在業務閉環過程中是一個完整體。業務人員分兩種,一種是完全不了解數據分析技術,一種是掌握一些數據分析技術。我們的產品在這兩種不同類型的人做數據消費時,都能形成一個閉環。不懂技術的可以去看數據,懂技術的可以去找數據資產,找到數據資產后通過編排快速生成專屬 Agent,或者基于問數繼續提問來得到答案。兩個產品之間可以實現快速的切換和連接。

如何發揮企業中人的力量,讓企業中的每個人都可以用智能的方式服務好相應的業務,這正是瓴羊致力于解決的問題。當然,AI 時代還將會有更多數據消費 Agent 實踐,期待與大家一起去挖掘更多的業務場景和價值。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2023-10-09 07:24:58

數據穩定性治理數據處理

2023-10-26 06:55:46

大數據數據倉庫

2019-01-29 15:25:11

阿里巴巴數據庫分庫分表

2010-06-28 10:43:47

2020-07-27 10:23:10

開源技術 數據

2013-08-22 09:41:52

阿里巴巴去IOE王堅

2015-03-02 16:33:25

大數據產品經濟云圖大數據

2015-08-30 16:20:34

阿里巴巴天池大數據涂子沛

2013-04-15 10:14:45

阿里巴巴大數據

2018-01-02 09:23:38

數據分析算法阿里巴巴

2017-09-28 13:30:55

阿里巴巴

2025-05-30 06:48:53

2013-08-22 09:36:45

阿里巴巴王堅阿里云

2019-08-15 10:25:02

代碼開發工具

2023-03-29 09:42:32

2009-02-27 10:46:32

DBA筆試題阿里巴巴

2020-07-14 14:58:17

阿里語音AI

2017-05-04 11:15:37

阿里

2023-06-20 07:46:27

數據治理大數據建設

2020-04-22 10:43:49

高并發數據阿里巴巴
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产高清免费 | 久夜精品| 久草新在线 | 成人亚洲视频 | 日本不卡一区二区三区在线观看 | 伊人超碰在线 | 韩日一区| 久久久久久99 | 日本精品久久 | 国产精品特级片 | 欧美色性| 免费久久久久久 | 亚洲一区二区三区免费在线观看 | 成人久久久 | 色在线视频网站 | www.三级| 一本大道久久a久久精二百 欧洲一区二区三区 | 成人在线免费视频 | 毛片网站在线观看 | 精品美女久久久 | 亚洲精品视频一区 | 国产免费一区二区 | 久久久毛片 | 欧美日韩精品一区二区三区视频 | 搞黄网站在线观看 | 国产ts一区 | av免费观看在线 | 国产精品高潮呻吟久久av黑人 | 久久精品亚洲欧美日韩精品中文字幕 | 99久久精品国产一区二区三区 | 亚洲精品自在在线观看 | 在线免费中文字幕 | 国产免费一区 | 一本久久a久久精品亚洲 | 国产一区二区中文字幕 | 日本激情一区二区 | 日韩视频免费 | 91麻豆产精品久久久久久夏晴子 | 国产激情一区二区三区 | 欧美国产精品 | 久久久久久久久久久久久久国产 |