成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop性能優(yōu)化及配置如何實現(xiàn)?

開發(fā) 架構(gòu) Hadoop
在學(xué)習(xí)Hadoop的過程中,你可能會遇到Hadoop性能方面的問題,本文就向大家簡單介紹一下Hadoop性能優(yōu)化及配置方面的內(nèi)容,歡迎大家一起來學(xué)習(xí)。

本節(jié)向大家介紹一下Hadoop性能方面的內(nèi)容,主要有Hadoop性能本地存放和Hadoop性能配置等內(nèi)容,希望通過本節(jié)的學(xué)習(xí)大家對Hadoop性能有更深一步的了解。下面是關(guān)于Hadoop性能的具體介紹。

hadoop性能優(yōu)化:hadoop機架感知實現(xiàn)及配置

背景

分布式的集群通常包含非常多的機器,由于受到機架槽位和交換機網(wǎng)口的限制,通常大型的分布式集群都會跨好幾個機架,由多個機架上的機器共同組成一個分布式集群。機架內(nèi)的機器之間的網(wǎng)絡(luò)速度通常都會高于跨機架機器之間的網(wǎng)絡(luò)速度,并且機架之間機器的網(wǎng)絡(luò)通信通常受到上層交換機間網(wǎng)絡(luò)帶寬的限制。
具體到hadoop集群,由于hadoop的HDFS對數(shù)據(jù)文件的分布式存放是按照分塊block存儲,每個block會有多個副本(默認(rèn)為3),并且為了數(shù)據(jù)的安全和高效,所以hadoop默認(rèn)對3個副

hadoop性能本地存放策略為:

在本地機器的hdfs目錄下存儲一個block
在另外一個rack的某個datanode上存儲一個block
在該機器的同一個rack下的某臺機器上存儲最后一個block
這樣的策略可以保證對該block所屬文件的訪問能夠優(yōu)先在本rack下找到,如果整個rack發(fā)生了異常,也可以在另外的rack上找到該block的副本。這樣足夠的高效,并且同時做到
hadoop性能了數(shù)據(jù)的容錯。但是,hadoop對機架的感知并非是自適應(yīng)的,亦即,hadoop集群分辨某臺slave機器是屬于哪個rack并非是只能的感知的,而是需要hadoop的管理者人為的告知hadoop哪臺機器屬于哪個rack,這樣在hadoop的namenode啟動初始化時,會將這些機器與rack的對應(yīng)信息保存在內(nèi)存中,用來作為對接下來所有的HDFS的寫塊操作分配datanode列表時(比如3個
block對應(yīng)三臺datanode)的選擇datanode策略,做到hadoopallocateblock的策略:盡量將三個副本分布到不同的rack。
接下來的問題就是:通過什么方式能夠告知hadoopnamenode哪些slaves機器屬于哪個rack?以下是配置步驟。

hadoop性能配置

默認(rèn)情況下,hadoop的機架感知是沒有被啟用的。所以,在通常情況下,hadoop集群的HDFS在選機器的時候,是隨機選擇的,也就是說,很有可能在寫數(shù)據(jù)時,hadoop將第一塊數(shù)
據(jù)block1寫到了rack1上,然后隨機的選擇下將block2寫入到了rack2下,此時兩個rack之間產(chǎn)生了數(shù)據(jù)傳輸?shù)牧髁浚俳酉聛恚陔S機的情況下,又將block3重新又寫回了rack1
,此時,兩個rack之間又產(chǎn)生了一次數(shù)據(jù)流量。在job處理的數(shù)據(jù)量非常的大,或者往hadoop推送的數(shù)據(jù)量非常大的時候,這種情況會造成rack之間的網(wǎng)絡(luò)流量成倍的上升,成為
性能的瓶頸,進(jìn)而影響作業(yè)的性能以至于整個集群的服務(wù)。
要將hadoop機架感知的功能啟用,配置非常簡單,在namenode所在機器的hadoop-site.xml配置文件中配置一個選項:
topology.script.file.name
/path/to/script

這個配置選項的value指定為一個可執(zhí)行程序,通常為一個腳本,該腳本接受一個參數(shù),輸出一個值。接受的參數(shù)通常為某臺datanode機器的ip地址,而輸出的值通常為該ip地址
對應(yīng)的datanode所在的rack,例如”/rack1”。Namenode啟動時,會判斷該配置選項是否為空,如果非空,則表示已經(jīng)用機架感知的配置,此時namenode會根據(jù)配置尋找該腳本,
并在接收到每一個datanode的heartbeat時,將該datanode的ip地址作為參數(shù)傳給該腳本運行,并將得到的輸出作為該datanode所屬的機架,保存到內(nèi)存的一個map中。
至于腳本的編寫,就需要將真實的網(wǎng)絡(luò)拓樸和機架信息了解清楚后,通過該腳本能夠?qū)C器的ip地址正確的映射到相應(yīng)的機架上去。本節(jié)關(guān)于Hadoop性能方面的內(nèi)容沒有介紹完,請繼續(xù)關(guān)注下節(jié)介紹。

【編輯推薦】

  1. Hadoop集群與Hadoop性能優(yōu)化
  2. Hadoop集群配置全程跟蹤報道
  3. 專家講解 Hadoop:HBASE松散數(shù)據(jù)存儲設(shè)計
  4. 兩種模式運行Hadoop分布式并行程序
  5. Hadoop命令手冊使用指南
責(zé)任編輯:佚名 來源: csdn.net
相關(guān)推薦

2010-06-07 09:14:55

Hadoop集群

2010-05-24 14:59:29

Hadoop集群

2019-08-02 11:28:45

HadoopYARN調(diào)度系統(tǒng)

2010-06-04 11:00:27

hadoop性能優(yōu)化

2010-08-13 09:01:39

2018-09-20 11:54:31

數(shù)據(jù)庫MySQL性能優(yōu)化

2020-10-16 09:00:12

前端開發(fā)技術(shù)

2023-10-18 10:38:53

API

2020-10-16 10:40:39

前端性能可視化

2021-11-18 10:05:35

Java優(yōu)化QPS

2013-12-16 17:35:14

2014-04-04 10:16:51

Nginx配置Nginx性能優(yōu)化

2010-06-03 15:13:34

Hadoop Hdfs

2024-03-12 09:47:10

Redis數(shù)據(jù)庫

2009-07-05 11:23:44

2011-03-01 17:26:48

WLAN優(yōu)化

2021-02-02 13:45:31

Vue代碼前端

2025-02-25 12:00:00

Java線程開發(fā)

2023-10-25 22:23:35

Dubbo路由

2014-06-05 10:22:06

Tomcat 7
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 手机在线不卡av | 久久久久国产精品 | 免费观看黄| 久久久精品一区二区三区 | caoporon| 久久综合成人精品亚洲另类欧美 | 久久久久久免费毛片精品 | 色视频网站免费 | 亚洲欧美中文日韩在线 | 中文字幕成人av | 日韩国产中文字幕 | 日本a视频| 亚洲日本免费 | 亚洲午夜精品一区二区三区 | 成年人国产在线观看 | 亚洲视频二 | 色久伊人 | 久久久婷婷 | 亚州精品成人 | 黄色片免费在线观看 | 亚洲欧美日韩精品久久亚洲区 | av一级毛片| 黄网站涩免费蜜桃网站 | 先锋av资源网 | 国产精品亚洲一区二区三区在线 | 天堂一区 | www视频在线观看 | 日韩精品 电影一区 亚洲 | 国产成人精品网站 | 成人精品一区 | 91av精品 | 日韩三级电影一区二区 | 欧美综合一区二区 | 91在线精品一区二区 | 日韩精品久久 | av小说在线| 成人精品免费视频 | 国产视频二区 | 四虎影音 | 久久9久 | 亚洲精品电影在线观看 |