成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

強化學習如何做數據分析?新加坡國立等TKDE 2022綜述論文

人工智能 深度學習 新聞
來自新加坡南洋理工大學的學者在TKDE發表了《深度強化學習數據處理與分析》的綜述論文,對最近的工作進行了全面的回顧,重點是利用DRL改進數據處理和分析。

?數據處理和分析是基礎和普遍的。算法在數據處理和分析中發揮著至關重要的作用,許多算法設計都結合了啟發式和人類知識和經驗的一般規則,以提高其有效性。

近年來,強化學習,特別是深度強化學習(DRL)在許多領域得到了越來越多的探索和利用,因為與靜態設計的算法相比,它可以在復雜的交互環境中學習更好的策略。受這一趨勢的推動,我們對最近的工作進行了全面的回顧,重點是利用DRL改進數據處理和分析。

首先,我們介紹了DRL中的關鍵概念、理論和方法。接下來,我們將討論DRL在數據庫系統上的部署,在各個方面促進數據處理和分析,包括數據組織、調度、調優和索引。

然后,我們調查了DRL在數據處理和分析中的應用,從數據準備、自然語言處理到醫療保健、金融科技等。

最后,我們討論了在數據處理和分析中使用DRL所面臨的重要挑戰和未來的研究方向。

論文鏈接:https://arxiv.org/abs/2108.04526

在大數據時代,數據處理和分析是基礎的、無處不在的,對于許多組織來說是至關重要的,這些組織正在進行數字化之旅,以改善和轉變其業務和運營。在提取洞察力之前,數據分析通常需要其他關鍵操作,如數據采集、數據清理、數據集成、建模等。

大數據可以在醫療保健和零售等許多行業釋放出巨大的價值創造。然而,數據的復雜性(例如,高容量、高速度和高多樣性)給數據分析帶來了許多挑戰,因此很難得出有意義的見解。為了應對這一挑戰,促進數據處理和分析的高效和有效,研究人員和實踐人員設計了大量的算法和技術,也開發了大量的學習系統,如Spark MLlib和Rafiki。

為了支持快速的數據處理和準確的數據分析,大量的算法依賴于基于人類知識和經驗開發的規則。例如,「最短作業優先」是一種調度算法,它選擇執行時間最短的作業進行下一次執行。但在沒有充分利用工作負載特性的情況下,與基于學習的調度算法相比,其性能較差。另一個例子是計算機網絡中的包分類,它將一個包與一組規則中的一條規則進行匹配。一種解決方案是使用手工調整的啟發式分類來構造決策樹。具體來說,啟發式算法是為一組特定的規則設計的,因此可能不能很好地工作于具有不同特征的其他工作負載。

我們觀察到現有算法的三個局限性:

首先,算法是次優的。諸如數據分布之類的有用信息可能會被忽略或未被規則充分利用。其次,算法缺乏自適應能力。為特定工作負載設計的算法不能在另一個不同的工作負載中很好地執行。第三,算法設計是一個耗時的過程。開發人員必須花很多時間嘗試很多規則,以找到一個經驗有效的規則。

基于學習的算法也被用于數據處理和分析。經常使用的學習方法有兩種:監督學習和強化學習。它們通過直接優化性能目標來實現更好的性能。監督學習通常需要一組豐富的高質量標注訓練數據,這可能是很難和具有挑戰性的獲取。例如,配置調優對于優化數據庫管理系統(DBMS)的整體性能非常重要。在離散和連續的空間中,可能有數百個調諧旋鈕相互關聯。此外,不同的數據庫實例、查詢工作負載和硬件特性使得數據收集變得不可用,尤其是在云環境中。

與監督學習相比,強化學習具有較好的性能,因為它采用了試錯搜索,并且需要更少的訓練樣本來找到云數據庫的良好配置。

另一個具體的例子是查詢處理中的查詢優化。數據庫系統優化器的任務是為查詢找到最佳的執行計劃,以降低查詢成本。傳統的優化器通常枚舉許多候選計劃,并使用成本模型來找到成本最小的計劃。優化過程可能是緩慢且不準確的。

在不依賴于不準確的成本模型的情況下,深度強化學習(DRL)方法通過與數據庫交互來改進執行計劃(例如,更改表連接順序)。

當查詢發送給agent(即DRL優化器)時,代理通過對基本信息(如訪問的關系和表)進行特征化,生成狀態向量。agent以狀態為輸入,利用神經網絡生成一個動作集的概率分布,動作集可以包含所有可能的作為潛在動作的join操作。

每個操作表示一對表上的部分連接計劃,一旦執行操作,狀態將被更新。在采取可能的行動之后,生成一個完整的計劃,然后由DBMS執行該計劃以獲得獎勵。

在這個查詢優化問題中,獎勵可以根據實際延遲計算。在有獎勵信號的訓練過程中,agent可以改進策略,產生更高獎勵的更好的連接排序(即延遲更少)。

查詢優化的DRL工作流程

強化學習(RL)專注于學習在環境中做出智能的行動。RL算法在探索和開發的基礎上,通過環境反饋來改進自身。在過去的幾十年里,RL在理論和技術方面都取得了巨大的進步。

值得注意的是,DRL結合了深度學習(DL)技術來處理復雜的非結構化數據,并被設計用于從歷史數據中學習和自我探索,以解決眾所周知的困難和大規模問題(如AlphaGo)。

近年來,來自不同社區的研究人員提出了DRL解決方案,以解決數據處理和分析中的問題。我們將現有的使用DRL的作品從系統和應用兩個角度進行分類。

從系統的角度來看,我們專注于基礎研究課題,從一般的,如調度,到系統特定的,如數據庫的查詢優化。我們還應當強調它是如何制定的馬爾可夫決策過程,并討論如何更有效地解決DRL問題與傳統方法相比。由于實際系統中的工作負載執行和數據采集時間比較長,因此采用了采樣、仿真等技術來提高DRL訓練效率。

從應用的角度來看,我們將涵蓋數據處理和數據分析中的各種關鍵應用,以提供對DRL的可用性和適應性的全面理解。許多領域通過采用DRL進行轉換,這有助于學習有關應用的領域特定知識。

在這次綜述中,我們的目標是提供一個廣泛和系統的回顧,在解決數據系統、數據處理和分析問題中使用DRL的最新進展。

RL技術分類?

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-12-29 10:04:47

數據分析

2018-05-18 09:18:00

數據分析報告數據收集

2024-03-11 00:20:00

模型論文

2022-10-19 11:30:30

數據分析項目TOB

2023-10-10 11:41:28

數據分析項目

2024-10-12 17:14:12

2015-11-16 10:17:21

工作數據分析

2017-05-19 08:45:34

R用戶Python數據分析

2024-09-10 15:10:00

智能強化學習框架

2022-02-25 15:08:16

強化學習職業博士

2023-03-09 08:00:00

強化學習機器學習圍棋

2020-08-10 06:36:21

強化學習代碼深度學習

2022-02-17 13:18:58

定價模型營銷AHP

2016-09-09 12:28:12

大數據

2022-12-21 17:27:30

強化學習AI

2024-04-11 12:30:52

模型數據

2012-09-25 11:06:56

IBM收購Butterfly

2022-10-09 11:32:52

數據分析業務銷量

2020-11-06 17:04:17

強化學習機器學習人工智能

2020-05-15 15:09:51

R語言數據分析
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 神马久久久久久久久久 | 国产免费视频在线 | 国产精品欧美一区二区三区不卡 | 欧美一区二区成人 | 久久网站黄 | 国产一区二区麻豆 | 精品一区二区三区在线观看国产 | 亚洲一区视频 | 日本精品久久久久久久 | а天堂中文最新一区二区三区 | 夏同学福利网 | 午夜小电影| 精品国产一区二区国模嫣然 | 精品久久久久久国产 | 一级毛片在线播放 | 毛片视频免费 | 午夜精品久久 | 欧美日韩久久久 | 日韩免费高清视频 | 99精品在线 | 色欧美片视频在线观看 | www.久久.com| www.一区二区 | www.99热.com| 日韩在线精品视频 | 一区观看 | 国产精品视频久久久 | 亚洲午夜精品一区二区三区他趣 | 色久影院 | 欧美日韩在线免费 | 中文字幕一区二区三区日韩精品 | 久久视频免费看 | 免费毛片网站 | 在线看片国产 | 色一级 | 欧美日日| www.欧美 | 日韩精品二区 | 国产一级一级国产 | 国产免费一区二区三区 | 玖玖视频网 |