成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何克服云端數據倉庫數據遷移問題?

云計算 數據倉庫
盡管傳統關系型數據庫管理系統和云端非關系型數據庫之間可以并行描述,但是在兩個片段之間轉移數據時,不同的運行方式會導致問題。抽取、轉換和加載流程甚至會造成更多挑戰。

   云計算和數據倉庫是合理的一對。云存儲可以按需擴展,云可以將大量服務器貢獻于某一具體任務。數據倉庫通用功能是本地數據分析工具,受到計算和存儲資源的限制,同時也受到設計者考慮新數據源集成的能力的限制。如果我們可以克服一些數據遷移的挑戰,將一個數據倉庫以及其數據分析工具從數據中心中的專用服務器轉移到基于云的文件系統和數據庫就可以解決這個問題。

  云端數據管理通常牽扯到在分布式文件系統中加載和維護文件,像Hadoop分布式文件系統(HDFS),隨后用類似MapReduce這樣的工具處理數據。對于數據倉庫和其他的分析人物,像Hive這樣的數據庫工具在分布式文件系統之上提供了類SQL的功能。

  盡管傳統關系型數據庫管理系統和云端非關系型數據庫之間可以并行描述,但是在兩個片段之間轉移數據時,不同的運行方式會導致問題。抽取、轉換和加載流程甚至會造成更多挑戰。

  數據遷移工具輔助向云端遷移

  從數據庫抽取數據很容易,從數據庫中有效挖掘大容量數據確是一項挑戰。如果由于數據量的增長,數據倉庫面臨性能或者存儲問題,可能就是時候考慮使用運資源了。下面提供了一些工具來協助從關系型數據庫加載數據到云文件系統和數據庫。

  專業工具,像Sqoop(SQL-to-Hadoop)生成代碼從關系型數據庫抽取數據,并將其拷貝到HDFS或者Hive。Sqoop使用JDBC驅動,同多種類型的關系型數據庫工作,但是通過JDBC推出大量數據導致了性能成本。

  為了遷移到云端,從關系型數據庫抽取數據時,你可能需要進行數據轉換。如果你所工作的所有數據來自于單一數據庫,就可以在源數據庫中進行轉換。如果從兩個分離的系統合并數據,在抽取之后再轉移數據源更有效。然而,你應該在加載數據到最終數據存儲庫之前做這些。Cascading數據處理API可以協助這項任務的進行。

  Cascading提供了運行在Hadoop之上的功能,像工作流處理、計劃和調度。就比如說,它同管道過濾器工作;數據應用過濾器通過管道從一個源流到目的源。其他功能像grouping可以應用于數據流。Cascading用Java實現,在MapReduce工作中調用轉換API。

  如果你正在同MySQL共事,Sqoop介意使用MySQL轉儲功能繞離JDBC并更加有效地抽取數據。Sqoop也可以生成Java類,這個類可以用于操縱加載數據并將其直接導入Hive。HIHO (Hadoop Input and Output)從關系型表抽取數據并提供一些基本的轉換服務,像去重以及合并輸入流。

  當生成文件在將其加載到HDFS文件系統或者Hive數據倉庫之前,要求最小化轉換,你就能直接加載文件了。在確定目標表和分割規格后,Hive有一個命令來加載數據。Pig是數據分析程序的一種高水平語言,尤其是和Java中的MapReduce編碼對比的時候。它提供了一種基本的統計函數,你可以在關系型數據庫中找到(像min、max、count),在數學和字符串處理功能中也能找到。Pig支持架構化和非結構化文本文件的壓縮。

  云計算資源補充了數據倉庫基礎架構。然而,為將數據倉庫轉移到云端的利益***化,適當結構化數據并使用正確的數據分析工具很重要。

責任編輯:鳶瑋 來源: TechTarget中國
相關推薦

2013-10-29 13:28:13

數據

2016-11-14 10:23:08

Hadoop工具大數據數據倉庫

2020-12-02 14:38:21

SQL數據庫MySQL

2020-02-17 11:37:54

大數據數據倉庫技術

2016-08-15 12:57:01

數據倉庫索引架構維度索引

2023-01-11 10:29:26

2016-11-08 09:16:54

數據倉庫優化

2021-09-01 10:03:44

數據倉庫云數據倉庫數據庫

2023-11-17 18:02:19

數據倉庫性能Doris

2021-03-03 21:24:57

數據倉庫工具

2020-04-06 13:52:45

數據倉庫大數據平臺Hadoop

2018-07-24 09:28:18

存儲數據倉庫

2013-03-20 16:23:53

數據清洗

2020-01-03 09:40:13

大數據數據倉庫分層

2022-11-29 17:16:57

2017-08-16 08:37:05

云遷移IP地址

2011-12-28 10:00:44

UnixLinux 遷移

2023-12-13 07:26:24

數據湖倉數據倉庫性能

2017-10-20 12:59:05

數據分層數據建設數據倉庫

2016-12-12 19:16:43

數據云端
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产一级片av | 日韩一区二区三区在线 | 久久精品国产a三级三级三级 | 手机av在线 | 欧美日韩国产在线观看 | 国产亚洲一区二区三区在线观看 | 亚洲精品日韩一区二区电影 | 婷婷综合色 | 一区二区三区av | 久久精品国产久精国产 | 欧美久久一区二区 | 久久99精品久久久97夜夜嗨 | 欧美黑人国产人伦爽爽爽 | 亚洲九九精品 | 久久精品久久久久久 | 国产激情自拍视频 | 色婷婷久久久亚洲一区二区三区 | 国产中文在线观看 | 久久久久久久久91 | 日本精品久久久久久久 | 亚洲欧美在线视频 | 特黄小视频 | 精品国产一区二区三区性色av | 亚洲人成人一区二区在线观看 | 亚洲激精日韩激精欧美精品 | 午夜激情免费视频 | av一区二区三区四区 | 亚洲精品一区二区网址 | 午夜欧美一区二区三区在线播放 | 91一区二区三区在线观看 | 欧美国产视频 | 91麻豆精品国产91久久久更新资源速度超快 | 中文字幕第90页 | 亚洲精品一区中文字幕乱码 | 美日韩免费| 国产高清免费视频 | 亚洲天堂二区 | 亚洲精品在线视频 | 亚洲欧美在线视频 | www.日韩 | 成人无遮挡毛片免费看 |