成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop概念及其用法專家講解

開發 架構 Hadoop
Hadoop的概念你是否聽說過,這里就向大家介紹一下Hadoop方面的知識,希望對此關興趣的朋友一起來關注,相信通過本文的介紹大家對Hadoop一定會有明確的認識。

本節和大家繼續學習Hadoop,Hadoop是一個分布式系統基礎架構,由Apache基金會開發。它有什么奧秘呢,就讓我們一起來繼續關注Hadoop吧。

條款6:多個大輸入的Job建議使用串行執行,多個小輸入的Job建議使用并行執行。

Hadoop的任務處理分為map階段以及reduce階段,當集群的taskslots足夠支持多個任務同時執行時,建議使用多任務并行執行,反之,建議使用串行執行,且當一個Job開始執行reducetask

時,可以開始執行下一個Job的maptask。

以下是我們在50臺退役機器上分別并行和串行運行2個100G,200G,300G的任務的測試結果:

條款7:reducer的個數應該略小于集群中全部reduceslot的個數。

maptask的個數由輸入文件大小決定,所以選擇合適的reducer的個數對充分利用Hadoop集群的性能有重要的意義。

Hadoop中每個task均對應于tasktracker中的一個slot,系統中mapperslots總數與reducerslots總數的計算公式如下:

mapperslots總數=集群節點數×mapred.tasktracker.map.tasks.maximum

reducerslots總數=集群節點數×mapred.tasktracker.reduce.tasks.maximum

設置reducer的個數比集群中全部的reducerslot略少可以使得全部的reducetask可以同時進行,而且可以容忍一些reducetask失敗。

條款8:多個簡單串行的Job優于一個復雜的Job。將復雜的任務分割成多個簡單的任務,這是典型的分治的思想。這樣不僅可以使得程序變得更簡單,職責更單一,而且多個串行的任務還可以

在上一個任務的正在執行reduce任務的時候,利用空閑的map資源來執行下一個任務。

4.Key-Value權衡
Map-Reduce算法的核心過程如下:

map(k1,v1)-->list(k2,v2)

reduce(k2,list(v2))-->list(v2)

即通過用戶定義的map函數將輸入轉換為一組<Key,Value>對,而后通過用戶定義的reduce函數將<Key,List<Value>>計算出***的結果。

如何選擇合適的map和reduce函數才能充分利用Hadoop平臺的計算能力呢?換句話說,如何選擇上式中合適的K2和V2呢?

條款9:maptask或reducetask的大小應該適中,以一個task運行2-3分鐘為宜,且task不能超出計算節點的運算能力。

雖然Hadoop平臺幫助我們將數據分割成為小任務來執行,但我們也應當意識到,每個task都是在一個計算節點運行的,若一個task對機器資源(CPU、內存、磁盤空間等)的需求超出了計算

節點的能力的話,任務將會失敗。而如果task過小的話,雖然計算節點能夠快速的完成task的執行,但過多的task的管理開銷,以及中間結果頻繁的網絡傳輸將占據任務執行的絕大部分時間,

這樣同樣會嚴重影響性能。建議的task大小***是以能夠運行2-3分鐘為宜。

條款10:map產生的中間結果不宜過大。

輸入數據經過用戶定義的map函數后生成的<Key,Value>對是Map-Reduce模型的中間計算結果。

Maptask將計算的中間結果保存在本地磁盤,而后通過Reducetask拉去所有當前任務所需的中間結果,并將中間結果按Key排序。顯然若map產生的中間結果過大,網絡傳輸時間以及中間結

果排序將占據大部分的Job執行時間。本節關于Hadoop的介紹到此結束。

【編輯推薦】

  1. 實例講解Hadoop用法
  2. 專家指導 如何進行Hadoop分布式集群配置
  3. Hadoop集群與Hadoop性能優化
  4. HadoopHBase實現配置簡單的單機環境
  5. 深入剖析Hadoop HBase

 

責任編輯:佚名 來源: csdn.net
相關推薦

2010-06-07 13:23:56

Hadoop 學習總結

2017-06-15 13:15:39

Python協程

2010-08-24 09:52:55

DIV標簽

2010-10-08 14:54:22

JavaScript特

2010-08-23 16:23:53

CSS+DIV

2010-09-14 09:41:56

DIV技術DIV標簽

2009-10-22 17:15:51

linux gcc

2010-07-09 15:13:42

UML對象圖

2010-06-03 18:22:38

Hadoop

2010-06-02 20:07:39

SVN管理系統

2009-07-31 09:32:04

ASP.NET緩存概念ASP.NET緩存應用

2010-08-27 13:46:58

DIV+CSS

2009-08-28 16:48:50

C#多態性

2022-05-18 23:42:08

網絡安全安全分析工具

2010-07-09 15:53:36

UML類圖

2021-03-08 08:54:12

驅動模型DTODO

2010-06-03 19:38:26

Hadoop

2010-06-10 14:56:18

UML建模語言

2020-06-03 15:35:10

數據挖掘算法大數據

2010-08-30 14:27:06

CSS樣式表
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 免费观看一级黄色录像 | 亚洲h视频 | 日韩在线视频观看 | 久久在线看 | 黄色毛片一级 | 久久精品视频网站 | 国产日韩欧美二区 | 国产精品久久久久久吹潮 | 谁有毛片| 日韩一区二区三区在线播放 | 欧美精| 黄色a三级 | 国产精品18久久久久久白浆动漫 | 国产精品免费看 | 爱爱综合网| 午夜精品久久久久久久久久久久久 | 亚洲一区久久 | 成人免费网站 | 国产精品久久久久av | 中文字幕一区二区三区精彩视频 | av男人的天堂av | 国产精品色综合 | 国产做a爱片久久毛片 | 日韩高清国产一区在线 | 国产在线拍偷自揄拍视频 | 日本午夜免费福利视频 | 国产精品美女久久久久aⅴ国产馆 | 久久久成人精品 | 99久久婷婷国产综合精品电影 | 国产精品一区二区福利视频 | 四季久久免费一区二区三区四区 | 欧美一区二区三区在线免费观看 | 日韩视频在线一区 | 欧美jizzhd精品欧美巨大免费 | 午夜激情视频在线 | 国产精品18hdxxxⅹ在线 | 国产乱码精品一区二区三区忘忧草 | 91麻豆精品国产91久久久久久久久 | 亚洲一区二区久久久 | 美女福利视频网站 | 久久精品国产一区 |