成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

小議Hadoop HDFS Balancer

運維 系統運維 Hadoop
Hadoop的HDFS集群非常容易出現機器與機器之間磁盤利用率不平衡的情況,比如集群中添加新的數據節點。當HDFS出現不平衡狀況的時候,將引發很多問題,我們該如何應對?

Hadoop的HDFS集群非常容易出現機器與機器之間磁盤利用率不平衡的情況,比如集群中添加新的數據節點。當HDFS出現不平衡狀況的時候,將引發很多問題,比如MR程序無法很好地利用本地計算的優勢,機器之間無法達到更好的網絡帶寬使用率,機器磁盤無法利用等等??梢?,保證HDFS中的數據平 衡是非常重要的。

在Hadoop中,包含一個Balancer程序,通過運行這個程序,可以使得HDFS集群達到一個平衡的狀態,使用這個程序的命令如下:

sh $HADOOP_HOME/bin/start-balancer.sh –t 10%

這個命令中-t參數后面跟的是HDFS達到平衡狀態的磁盤使用率偏差值。如果機器與機器之間磁盤使用率偏差小于10%,那么我們就認為HDFS集群已經達到了平衡的狀態。

Hadoop的開發人員在開發Balancer程序的時候,遵循了以下幾點原則:

1.  在執行數據重分布的過程中,必須保證數據不能出現丟失,不能改變數據的備份數,不能改變每一個rack中所具備的block數量。

2.  系統管理員可以通過一條命令啟動數據重分布程序或者停止數據重分布程序。

3.  Block在移動的過程中,不能暫用過多的資源,如網絡帶寬。

4.  數據重分布程序在執行的過程中,不能影響name node的正常工作。

基于這些基本點,目前Hadoop數據重分布程序實現的邏輯流程如下圖所示:

Rebalance程序作為一個獨立的進程與name node進行分開執行。

1 Rebalance Server從Name Node中獲取所有的Data Node情況:每一個Data Node磁盤使用情況。

2 Rebalance Server計算哪些機器需要將數據移動,哪些機器可以接受移動的數據。并且從Name Node中獲取需要移動的數據分布情況。

3 Rebalance Server計算出來可以將哪一臺機器的block移動到另一臺機器中去。

4,5,6 需要移動block的機器將數據移動的目的機器上去,同時刪除自己機器上的block數據。

7  Rebalance Server獲取到本次數據移動的執行結果,并繼續執行這個過程,一直沒有數據可以移動或者HDFS集群以及達到了平衡的標準為止。

Hadoop現有的這種Balancer程序工作的方式在絕大多數情況中都是非常適合的。

現在我們設想這樣一種情況:

1 數據是3份備份。

2 HDFS由2個rack組成。

3 2個rack中的機器磁盤配置不同,第一個rack中每一臺機器的磁盤空間為1TB,第二個rack中每一臺機器的磁盤空間為10TB。

4 現在大多數數據的2份備份都存儲在第一個rack中。

在這樣的一種情況下,HDFS級群中的數據肯定是不平衡的?,F在我們運行Balancer程序,但是會發現運行結束以后,整個HDFS集群中的數據依舊不平衡:rack1中的磁盤剩余空間遠遠小于rack2。

這是因為Balance程序的開發原則1導致的。

簡單的說,就是在執行Balancer程序的時候,不會將數據中一個rack移動到另一個rack中,所以就導致了Balancer程序永遠無法平衡HDFS集群的情況。

針對于這種情況,可以采取2中方案:

  • 繼續使用現有的Balancer程序,但是修改rack中的機器分布。將磁盤空間小的機器分叉到不同的rack中去。
  • 修改Balancer程序,允許改變每一個rack中所具備的block數量,將磁盤空間告急的rack中存放的block數量減少,或者將其移動到其他磁盤空間富余的rack中去。
責任編輯:黃丹 來源: 博客
相關推薦

2023-03-30 13:32:51

負載均衡器HDFS

2023-04-03 06:57:38

DataNode工具命令行

2010-06-03 15:13:34

Hadoop Hdfs

2010-06-03 15:25:31

Hadoop Hdfs

2018-12-27 12:34:42

HadoopHDFS分布式系統

2010-06-07 13:35:16

Hadoop簡介

2012-07-11 17:21:23

HadoopHDFS

2010-11-24 10:26:54

Novell SUSE

2010-06-07 13:23:56

Hadoop 學習總結

2012-07-05 10:51:57

Hadoop集群

2017-08-03 10:38:32

HADOOP1.XHDFSHadoop

2019-11-06 08:54:21

HDFSHadoopMapReduce

2012-07-13 10:17:39

HadoopHDFS

2011-05-26 16:18:51

Mongodb

2022-04-10 19:55:09

OpenELB云原生

2015-10-29 17:55:32

存儲雙活宕機銀行

2018-03-01 16:26:30

HDFSHadoop系統

2013-03-08 10:09:30

Hadoop

2017-06-08 11:00:09

HDFSHadoopYARN

2019-03-21 11:03:47

HDFSMapReduceHadoop
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: www.日日操| 在线播放一区二区三区 | 91av在线免费观看 | 国产高清视频一区 | 日韩国产欧美一区 | 久久在线视频 | 羞羞免费网站 | 欧美一级毛片免费观看 | 婷婷国产一区二区三区 | 国产福利二区 | 人人干人人干人人干 | 国产成人精品一区二区三区四区 | 欧美福利网站 | 91精品国产乱码久久蜜臀 | 色综合中文 | 久久av一区二区三区 | 亚洲 中文 欧美 日韩 在线观看 | 欧美三级视频在线观看 | 国产精品二区三区在线观看 | 欧美一级艳情片免费观看 | 日本在线中文 | 成人一区二区三区在线观看 | 日本三级在线网站 | 欧美xxxx做受欧美 | 免费一看一级毛片 | 日韩一区二区在线播放 | 免费国产视频在线观看 | 欧美成人精品一区二区三区 | 久久国产精品久久久久久 | 超碰成人在线观看 | 成人在线免费视频 | 欧美黄a | 日本在线看片 | 亚洲一区二区在线电影 | 久久久亚洲成人 | 久久免费观看一级毛片 | 五月婷婷丁香 | 伊大人久久 | 婷婷久久综合 | 日韩和的一区二区 | 成人免费视频播放 |