成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

傳統數倉的三大缺陷,一篇梳理清楚

大數據 數據倉庫
使用Hive作為數倉,受限于HDFS的性能瓶頸,Hive的查詢速度比較慢,難以支撐低延遲場景,無法應用在實時計算的場景中。

1、效率低

傳統的數倉大多構建在Hadoop之上。這位傳統的數倉帶來了近乎無限的橫向擴展能力,同時也造成了傳統的數倉技術效率低的缺陷。效率低主要體現在以下幾個方面。

部署效率低:在部署Hive/HBase/Kylin之前,必須部署好Hadoop集群。和傳統數據庫相比,這個部署效率是非常低效的。

運維效率低:Hive/HBase/Kylin基于Hadoop,Hadoop生態會帶來一個非常嚴重的單點故障問題,即Hadoop體系中任何一個組件出現問題,都可能引起整個系統的不可用。使用傳統的數倉對運維的要求非常高。

計算效率低:主要體現在Hive和Kylin上,這兩個數倉沒有自己的存儲引擎和計算引擎,這導致Hive和Kylin只能依靠堆機器實現復雜查詢,而無法從數據本身下手。在大數據后期,一些以數據快速查詢為目標而特殊設計的數據存儲格式成為標準,這個現象才有所改觀。而HBase的優化核心就是重新設計的存儲引擎,使得HBase可以對數據本身進行查詢速度的優化。

2、延遲高

構建在Hadoop之上的數倉引擎,除了效率低的缺點之外,還面臨著高延遲的挑戰。高延遲主要體現在以下幾個方面。

查詢延遲高:使用Hive作為數倉,受限于HDFS的性能瓶頸,Hive的查詢速度比較慢,難以支撐低延遲場景,無法應用在實時計算的場景中。

寫入數據延遲高:同樣受限于HDFS,Hive的數據寫入延遲也很高,這意味著數據無法實時寫入Hive,從而無法支撐實時分析場景。

3、成本高

傳統的數倉數倉引擎還會帶來成本高的挑戰,主要體現在以下幾個方面.

部署成本高:由于Hadoop的計算邏輯是通過堆計算資源的方式來攤銷復雜查詢的時間,因此如果需要達到一個比較理想的性能,必須要求集群中節點的數量達到一定的規模,否則因為計算效率低的特點,單機很容易成為性能瓶頸。這導致了Hive等基于Hadoop的數倉部署成本高的缺陷。

運維成本高:集群服務器達到一定規模后,運維成本會指數級上升。同時,由于Hadoop中組件太多,任何一個組件的失效都有可能導致整個服務的不可用,因此運維團隊必須包含所有組件的運維人員,否則運維團隊有可能很好地執行任務。這也極大地提高了運維團隊的人力成本。

存儲成本高:Hadoop的HDFS為了避免集群中服務器故障從而導致的不可用的情況,默認使用三副本策略存儲數據,即數據會保存三份。這會極大地提高存儲成本。即使是新一代的Hadoop采用了EC糾刪碼技術降低了副本數量,但使用場景有限只適合在冷數據存儲中使用,對于經常需要查詢的熱數據,并不適合采用該方案。

決策成本高:傳統的大數據由于部署成本高,導致企業在做決策時面臨比較大的決策成本,一方面是前期投入太大,短期內看不到效果,長期以來效果如何也很難說清楚。另一方面是即使企業下定決心來建設數倉,昂貴的基礎設施和專業技術人員的缺乏也會造成很長的建設周期,長的建設周期又會帶來很多不可預知的變數,最終影響企業的決策。

本文摘編自《ClickHouse性能之巔:從架構設計解讀性能之謎》,經出版方授權發布。(書號:9787111716587)轉載請保留文章出處。

關于作者:陳峰,資深大數據專家和架構師,ClickHouse技術專家,滴普科技(2B領域獨角獸)合伙人兼首席架構師。《ClickHouse性能之巔:從架構設計解讀性能之謎》作者。

責任編輯:武曉燕 來源: 數倉寶貝庫
相關推薦

2023-01-12 09:06:58

2023-06-01 21:50:53

Doris數倉SQL

2025-04-22 11:00:00

網絡協議通信網絡

2018-09-26 16:04:04

NVMe主機控制器

2019-07-11 10:29:28

操作系統虛擬機Linux

2022-01-04 09:53:37

Python多線程多進程

2024-03-27 18:22:58

Hadoop部件生態

2025-05-13 01:10:00

數據產品開發

2017-12-17 20:17:23

NoSQLSQL數據

2018-08-13 09:20:21

NoSQLSQL數據

2022-04-27 09:09:57

架構師術語技術語言

2022-09-15 09:32:42

數據倉處理

2021-04-21 10:00:08

MySQL索引數據庫

2022-07-21 21:19:48

元宇宙

2019-12-03 08:22:42

JWTJWSJWE

2019-12-06 09:16:23

Linux 開源操作系統

2024-11-29 18:37:07

2019-11-25 08:25:47

ZooKeeper分布式系統負載均衡

2020-04-15 16:34:48

大數據質量標準

2019-08-22 10:07:37

SSL協議TCP
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久99视频 | 精久久久| 九九热在线观看 | 亚洲欧美视频一区 | 国产亚洲一区二区三区 | 成人精品鲁一区一区二区 | 亚洲狠狠丁香婷婷综合久久久 | 久久久性 | 成人在线视频免费观看 | 亚洲精品视频在线 | 国产精品视频一二三区 | 男女羞羞视频免费看 | 综合九九 | 国产精品成人国产乱一区 | 色综合一区二区三区 | 欧美老少妇一级特黄一片 | 久久99精品视频 | 三级av在线 | 国产激情视频 | 午夜电影网 | 天天看天天干 | 久久精品亚洲一区二区三区浴池 | 国产精品一卡二卡三卡 | 国产一区在线免费观看 | 欧美精品一区二区免费视频 | 操网站 | 日韩精品视频一区二区三区 | 亚洲精品一区av在线播放 | 91在线播| 一级特黄色毛片 | 亚洲欧美日韩在线一区二区 | 999国产视频 | 久久午夜精品 | 日韩欧美国产综合 | 国产免费播放视频 | 国产日韩欧美 | 午夜色播 | 免费观看羞羞视频网站 | 日本中出视频 | 国产精品久久久久久亚洲调教 | 99精品视频在线观看 |