成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop0.20更新筆記

開發 架構 Hadoop
Hadoop相信大家應該有所了解,隨著Hadoop的快速發展,他已經更新了多個版本,這里向大家介紹一下Hadoop0.20更新問題,歡迎大家一起來學習。

本節向大家介紹一下Hadoop0.20更新的內容,在學習Hadoop的過程中你可能會遇到這方面的問題,在這里和大家分享一下,相信通過本節的介紹大家對Hadoop0.20更新有一定的認識。下面是詳細介紹。

Hadoop0.20更新筆記

最近學習hadoop0.20.1,網上找到一篇文章《What’sNewinHadoopCore0.20》,非完整的給翻譯了一下,為以后檢索方便,發上來保存一份。如果能讀懂英文的,千萬不要看下面的中文。

  HadoopCore0.20.0在2009年4月22日發布。這一發布相對0.19發布,有很多用戶使用層面上的改變。

Core
  Hadoop中兩個主要的組件是分布式文件系統(HDFS)和MapReduce,那兩個組件分別挪入各自的子項目中,因此他們能擁有自己的發布周期,并且更容易對開發進行管理。但是在0.20發布中,這兩個組件還是在一起發布。在這次發布中,hadoop-size.xml被拆分成三個配置文件:core-site.xml、hdfs-site.xml和mapred-site.xml(HADOOP-4631)。你也可以繼續使用單一的hadoop-site.xml,hadoop僅僅會提出一個警告而已。默認配置文件已經移出conf文件夾,轉而放到.jar文件中,其內容可以看docs文件夾中的html文件。不贊成start-all.sh、stop-all.sh的使用,建議使用start-dfs.sh、start-mapred.sh、stop-dfs.sh、stop-mapred.sh來代替。
  上面說的是一些主要的變化,而允許slaves文件中加注注釋(HADOOP-4454)對實際操作更為有用。
  Hadoop配置文件支持Xinclude元素,用于引入其他的配置文件(HADOOP-4944(url:https://issues.apache.org/jira/browse/HADOOP-4944))。這一機制能讓配置文件更加模塊化、更易于重用。
  圍繞安全問題,hadoop作出了一系列動作。其中0.20.0增加了service-levelauthorization(HADOOP-4348)。開發人員能夠限制客戶端與hadoopdaemons的通信。
  LZOcompressionlibraries因為許可的原因移出了hadoopcore,如果你的代碼使用GPL許可證,你還是能從hadoop-gpl-compression項目中得到LZO。

HDFS
  HSFSappend從0.19.1開始默認disable。
  hadoop增加了一個新的管理命令:hadoopdfsadmin-saveNamespace。在安全模式下,這個命令能讓namenode轉存namespace到磁盤。

MapReduce
  在Hadoop0.20更新中,***的變化是加入了一個叫“ContextObjects”的新JavaAPI。把Mapper和Reduce通過引入ContextObject變成抽象類(不是接口),是為了讓API將來更易于演進。
  1.JobConf不再存在,Job配置信息由Configuration持有;
  2.現在在map()或reduce()方法中,更容易得到job配置信息。僅需要調用context.getConfiguration()。
  3.新的API支持pull形式的迭代。在此之前,如果你想在mapper中遍歷一下記錄,你不得不把他們保存到Mapper類的實例變量中。在新的API中,只需要調用nextKeyValue()即可。
  4.你還能覆蓋run()方法,來控制mapper如何運行。
  5.新API中不再有IdentityMapper和IdentityReducer兩個類,因為默認Mapper和Reducer執行了標識函數。
  新的API并非向后兼容,所以你必須重寫你的應用。注意,新的API在org.apache.hadoop.mapreduce包及其子包中,而舊的API在org.apache.hadoop.mapred。
  Multipletaskassignment,這一優化讓JobTracker在一次心跳周期內能分配給tasktracker多個任務,提高了利用率。同時引入mapred.reduce.slowstart.completed.maps新的配置參數(默認0.05)。
  Inputformats增加了一些有意思的改進。FileInputFormat在選擇那個主機有更多的需要分割的文件上做的更好。在另一方面0.20引入了CombineFileInputFormat類,他能把許多小文件變成一個split。
  Gridmix2是第二代MapReduce工作量基準模型套件。

Contrib
  兩個新捐獻的模塊在0.20分支中出現:
  HDFSProxy,他能暴露HDFS一個只讀的HSFTP接口,用于提供安全的、只讀的訪問。
  Vaidya,這是一個工具,用于在MapReducejob運行后通過檢查作業歷史和配置信息來診斷錯誤。針對常見的問題能提供一些改進意見,使得你的代碼能避免出錯。本節關于Hadoop0.20更新介紹到這里。

【編輯推薦】

  1. Hadoop-0.20.0源代碼中關鍵的類
  2. Hadoop0.20.2集群配置入門指導手冊
  3. Hadoop文件系統如何快速安裝?
  4. Hadoop集群搭建過程中相關環境配置詳解
  5. Hadoop完全分布模式安裝實現詳解
責任編輯:佚名 來源: csdn.net
相關推薦

2012-10-09 13:50:59

蘋果

2020-05-11 17:06:37

微軟筆記本換屏

2011-04-28 09:22:14

Aspire時睿

2020-02-20 19:47:03

微軟Windows操作系統

2011-08-30 16:26:34

Hadoop

2013-05-27 14:19:39

Hadoop

2023-08-03 09:55:58

筆記本庫存新驅動

2010-06-03 11:12:55

Hadoop

2010-06-03 11:34:42

Hadoop

2020-05-29 22:11:30

模式風扇性能

2010-06-04 18:17:50

Hadoop集群

2011-04-20 16:39:12

筆記本東芝

2018-04-11 10:04:55

筆記工具微信收藏

2021-02-26 14:34:49

筆記本屏幕TN

2013-08-21 14:57:42

objective-c問題

2010-06-07 16:34:07

Hadoop0.20.

2019-10-15 18:30:28

機械硬盤硬盤Windows 10

2017-05-10 09:10:46

2015-08-19 14:43:19

pighadoop
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩精品一区二区三区高清免费 | 久久国产一区二区三区 | 精品国产一区二区国模嫣然 | 一区二区精品电影 | 97精品超碰一区二区三区 | 日韩精品成人 | 国产性色视频 | 97色伦网| 午夜免费视频观看 | 久久久久免费精品国产 | 日韩欧美大片在线观看 | 精品国产乱码久久久久久蜜臀 | 久久这里只有 | 欧美日韩不卡合集视频 | 欧洲色 | a在线视频 | 希岛爱理在线 | 国际精品鲁一鲁一区二区小说 | 中文字幕 欧美 日韩 | 国产精品夜间视频香蕉 | 一区二区三区在线免费观看 | 在线视频91 | 欧美黄在线观看 | 亚洲毛片 | 成人精品国产一区二区4080 | 国产亚洲网站 | 亚洲国产精品va在线看黑人 | 日本高清不卡视频 | 亚洲精品美女视频 | 二区亚洲 | 免费在线观看一区二区 | 午夜av成人 | 国外成人在线视频网站 | 国产成人精品视频 | 激情的网站 | 在线免费观看毛片 | 国产精品自产拍在线观看蜜 | 青青久久 | 欧美一二三区 | 嫩草视频免费 | 国产a区 |