成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop MapReduce兩種常見的容錯場景分析

開發 前端 Hadoop
本文將分析Hadoop MapReduce(包括MRv1和MRv2)的兩種常見的容錯場景,第一種是,作業的某個任務阻塞了,長時間占用資源不釋放,如何處理?另外一種是,作 業的Map Task全部運行完成后,在Reduce Task運行過程中,某個Map Task所在節點掛了,或者某個Map Task結果存放磁盤損壞了,該如何處理?

本文將分析Hadoop MapReduce(包括MRv1和MRv2)的兩種常見的容錯場景,***種是,作業的某個任務阻塞了,長時間占用資源不釋放,如何處理?另外一種是,作 業的Map Task全部運行完成后,在Reduce Task運行過程中,某個Map Task所在節點掛了,或者某個Map Task結果存放磁盤損壞了,該如何處理?

***種場景:作業的某個任務阻塞了,長時間占用資源不釋放,如何處理?

這種場景通常是由于軟件Bug、數據特殊性等原因導致的,會讓程序阻塞,任務運行停滯不前。在外界看來,任務(Task)好像阻塞了一樣。這種事情 經常發生,由于任務長時間占用著資源但不使用(如果不采取一定的手段,可能永遠不會被使用,造成“資源泄露”),會導致資源利用率下降,對系統不利,那 么,Hadoop MapReduce遇到這種情況如何處理呢?

在TaskTracker上,每個任務會定期向TaskTracker匯報新的進度(如果進度不變則不匯報),并由TaskTracker進一步匯 報給JobTracker。當某個任務被阻塞時,它的進度將停滯不前,此時任務不會向TaskTracker匯報進度,這樣,一定達到超時時間上 限,TaskTracker會將該任務殺掉,并將任務狀態(KILLED)匯報給JobTracker,進而觸發JobTracker重新調度該任務。

在實際應用場景中,有些正常的作業,其任務可能長時間沒有讀入或者輸出,比如讀取數據庫的Map Task或者需要連接其他外部系統的Task,對于這類應用,在編寫Mapper或Reducer時,應當啟動一個額外的線程通過Reporter組件定 期向TaskTracker匯報心跳(只是告訴TaskTracker自己還活著,不要把我殺了)。

第二種場景:作業的Map Task全部運行完成后,在Reduce Task運行過程中,某個Map Task所在節點掛了,或者Map結果存放磁盤損壞了,該如何處理?

這種場景比較復雜,需分開討論。

如果節點掛了,JobTracker通過心跳機制知道TaskTracker死掉了,會重新調度之前正在運行的Task和正在運行的作業中已經運行完成的Map Task。

如果節點沒有掛,只是存放Map Task結果的磁盤損壞了,則分兩種情況:

(1)所有的Reduce Task已經完成shuffle階段

(2)尚有部分Reduce Task沒有完成shuffle階段,需要讀取該Map Task任務

對于***種情況,如果所有Reduce Task一路順風地運行下去,則無需對已經運行完成的Map Task作任何處理,如果某些Reduce Task一段時間后運行失敗了,則處理方式與第二種一樣。

對于第二種情況,當Reduce Task遠程讀取那個已經運行完成的Map Task結果(但結果已經損壞)時,會嘗試讀取若干次,如果嘗試次數超過了某個上限值,則會通過RPC告訴所在的TaskTracker該Map Task結果已經損壞,而TaskTracker則進一步通過RPC告訴JobTracker,JobTracker收到該消息后,會重新調度該Map Task,進而重新計算生成結果。

需要強調的是,目前Hadoop MapReduce的實現中,Reduce Task重試讀取Map Task結果的時間間隔是指數形式遞增的,計算公式是10000*1.3^noFailedFetches,其中noFailedFetches取值范圍 為MAX{10, numMaps/30},也就是說,如果map task數目是300,則需要嘗試10次才會發現Map Task結果已經損壞,嘗試時間間隔分別是10s,13s,21s,28s,37s,48s,62s,81s和106s,需要非常長的時間才能發現,而且 Map Task越多,發現時間越慢,這個地方通常需要調優,因為任務數目越多的作業,越容易出現這種問題。

MapReduce V2.0中,所有任務(Map Task和Reduce Task)直接跟MRAppMaster交互,不需要通過類似于TaskTracker這樣的中間層,整個過程與上述過程類似,在此不再贅述,具體可閱讀書籍《Hadoop技術內幕:深入解析YARN架構設計與實現原理》中的“第8章 離線計算框架MapReduce”。

責任編輯:陳四芳 來源: dongxicheng.org
相關推薦

2013-05-27 14:31:34

Hadoop 2.0

2019-10-11 07:56:37

物聯網應用物聯網IOT

2009-06-29 18:11:40

JSP設計模式

2010-05-26 18:20:59

SVN庫

2022-01-26 00:36:24

vue組件化通信

2019-08-09 09:00:40

cp命令BashLinux

2009-03-04 10:38:36

Troubleshoo桌面虛擬化Xendesktop

2022-05-23 11:35:16

jiekou冪等性

2009-12-25 11:30:44

2009-11-02 11:00:42

2009-10-30 11:30:38

2025-04-07 01:11:00

右值C++泛型

2010-10-11 10:31:51

MySQL分區

2009-09-14 19:25:09

Ruby form

2009-10-29 17:17:01

接入層技術

2025-03-05 10:56:12

VLAN網絡IP

2021-05-27 10:57:01

TCP定時器網絡協議

2010-07-08 10:38:24

MS SQL Serv

2010-06-03 19:28:02

Hadoop

2011-03-03 10:26:04

Pureftpd
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久免费观看视频 | 综合久久av| 久久电影一区 | 国产精品久久久久久妇女 | 国产精彩视频在线观看 | av黄色在线 | 一级黄色片日本 | 国产亚洲精品一区二区三区 | 亚洲一区二区视频 | 日韩在线精品视频 | 国产91视频播放 | 就操在线 | 欧美国产91 | 四色成人av永久网址 | 国产一区二区三区在线看 | 国产91亚洲精品 | 亚洲伊人精品酒店 | 午夜精品视频一区 | 一区二区三区国产精品 | 草比网站 | 欧美性猛片aaaaaaa做受 | 久草视频在 | 亚洲一区二区在线 | 国产区在线看 | 免费精品视频一区 | 免费久 | 国产一区二区三区视频在线观看 | 精品国产一区二区三区av片 | 精品欧美色视频网站在线观看 | 成人av片在线观看 | 高清色视频| 91在线精品视频 | 亚州综合一区 | 亚洲欧洲一区二区 | 欧美h视频 | 日韩电影一区 | 一级视频在线免费观看 | 亚洲 欧美 精品 | 久久久久久99 | 欧美a在线 | 亚洲电影专区 |