成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

學習筆記 Hadoop組成詳解

開發 架構 Hadoop
Hadoop你是否熟悉,這里先大致介紹一下Hadoop,先說一下Hadoop的來龍去脈,以及Hadoop主要包含的內容,歡迎大家一起來學習Hadoop。

本節和大家學習一下Hadoop方面的知識,內容主要有Hadoop概念介紹和Hadoop組成,希望通過本節的學習大家對Hadoop有初步的了解,下面讓我們一起來學習Hadoop吧。

Hadoop學習筆記

這里先大致介紹一下Hadoop,先說一下Hadoop的來龍去脈。談到Hadoop就不得不提到Lucene和Nutch。
首先,Lucene并不是一個應用程序,而是提供了一個純Java的高性能全文索引引擎工具包,它可以方便的嵌入到各種實際應用中實現全文搜索/索引功能。Nutch是一個應用程序,是一個以Lucene為基礎實現的搜索引擎應用,Lucene為Nutch提供了文本搜索和索引的API,Nutch不光有搜索的功能,還有數據抓取的功能。在nutch0.8.0版本之前,Hadoop還屬于Nutch的一部分,而從nutch0.8.0開始,將其中實現的NDFS和MapReduce剝離出來成立一個新的開源項目,這就是Hadoop,而nutch0.8.0版本較之以前的Nutch在架構上有了根本性的變化,那就是完全構建在Hadoop的基礎之上了。在Hadoop中實現了Google的GFS和MapReduce算法,使Hadoop成為了一個分布式的計算平臺。
其實,Hadoop并不僅僅是一個用于存儲的分布式文件系統,而是設計用來在由通用計算設備組成的大型集群上執行分布式應用的框架。

Hadoop包含兩個部分:

1、HDFS

即HadoopDistributedFileSystem(Hadoop分布式文件系統)
HDFS具有高容錯性,并且可以被部署在低價的硬件設備之上。HDFS很適合那些有大數據集的應用,并且提供了對數據讀寫的高吞吐率。HDFS是一個master/slave的結構,就通常的部署來說,在master上只運行一個Namenode,而在每一個slave上運行一個Datanode。
HDFS支持傳統的層次文件組織結構,同現有的一些文件系統在操作上很類似,比如你可以創建和刪除一個文件,把一個文件從一個目錄移到另一個目錄,重命名等等操作。Namenode管理著整個分布式文件系統,對文件系統的操作(如建立、刪除文件和文件夾)都是通過Namenode來控制。

從HDFS結構圖中可以知道,Namenode,Datanode,Client之間的通信都是建立在TCP/IP的基礎之上的。當Client要執行一個寫入的操作的時候,命令不是馬上就發送到Namenode,Client首先在本機上臨時文件夾中緩存這些數據,當臨時文件夾中的數據塊達到了設定的Block的值(默認是64M)時,Client便會通知Namenode,Namenode便響應Client的RPC請求,將文件名插入文件系統層次中并且在Datanode中找到一塊存放該數據的block,同時將該Datanode及對應的數據塊信息告訴Client,Client便這些本地臨時文件夾中的數據塊寫入指定的數據節點。
HDFS采取了副本策略,其目的是為了提高系統的可靠性,可用性。HDFS的副本放置策略是三個副本,一個放在本節點上,一個放在同一機架中的另一個節點上,還有一個副本放在另一個不同的機架中的一個節點上。當前版本的hadoop0.12.0中還沒有實現,但是正在進行中,相信不久就可以出來了。

2、MapReduce的實現

MapReduce是Google的一項重要技術,它是一個編程模型,用以進行大數據量的計算。對于大數據量的計算,通常采用的處理手法就是并行計算。至少現階段而言,對許多開發人員來說,并行計算還是一個比較遙遠的東西。MapReduce就是一種簡化并行計算的編程模型,它讓那些沒有多少并行計算經驗的開發人員也可以開發并行應用。
MapReduce的名字源于這個模型中的兩項核心操作:Map和Reduce。也許熟悉FunctionalProgramming(函數式編程)的人見到這兩個詞會倍感親切。簡單的說來,Map是把一組數據一對一的映射為另外的一組數據,其映射的規則由一個函數來指定,比如對[1,2,3,4]進行乘2的映射就變成了[2,4,6,8]。Reduce是對一組數據進行歸約,這個歸約的規則由一個函數指定,比如對[1,2,3,4]進行求和的歸約得到結果是10,而對它進行求積的歸約結果是24。
關于MapReduce的內容,建議看看孟巖的這篇MapReduce:TheFreeLunchIsNotOver!
好了,作為這個系列的第一篇就寫這么多了,我也是剛開始接觸Hadoop,下一篇就是講Hadoop的部署,談談我在部署Hadoop時遇到的問題,也給大家一個參考,少走點彎路。
 

【編輯推薦】

  1. 如何進行Hadoop安裝部署?
  2. Hadoop開源已經實現
  3. Hadoop集群與Hadoop性能優化
  4. Hadoop 從Yahoo向Google的技術轉折
  5. Hadoop入門經典

 

 

責任編輯:佚名 來源: csdn.net
相關推薦

2011-08-30 16:26:34

Hadoop

2010-06-03 11:34:42

Hadoop

2010-07-07 17:51:06

UML類圖

2010-06-28 16:37:05

UML類圖

2010-07-01 11:52:59

UML類圖

2010-06-04 18:17:50

Hadoop集群

2010-06-30 10:02:05

UML建模技術

2010-06-29 13:22:26

UML類圖

2010-08-31 11:25:15

2011-09-07 10:34:48

Android Wid

2010-09-14 16:20:19

DIV定位

2011-07-26 15:29:36

Cocoa 模式

2010-07-06 11:07:11

UML組件圖

2010-08-26 16:40:35

DIV定位

2010-09-27 13:48:41

JVM內存結構

2009-11-16 13:18:10

PHP上傳圖片代碼

2010-06-01 12:49:04

SVN分支模式

2010-06-01 19:55:30

SVN使用

2010-06-02 09:06:26

SVN學習

2010-09-07 10:39:59

CSS偽元素
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美日韩一区二区三区在线观看 | 成人在线一区二区三区 | 日韩欧美国产一区二区三区 | 欧美成人a | 99精品99久久久久久宅男 | 日本一区二区视频 | 日本aaaa| 国产精品久久久久久久久久不蜜臀 | 亚洲电影在线播放 | 成人伊人| 91精品国产91久久久久久吃药 | 亚洲人在线播放 | 亚洲va欧美va天堂v国产综合 | 国产亚洲精品久久久久久豆腐 | 日本中文字幕视频 | 亚洲一区二区三区免费在线 | 精品久久久久久亚洲综合网 | 亚洲精品9999 | 欧美中文在线 | 可以免费观看的av片 | 欧美精品区 | 国产精品视频一区二区三区, | 国产日韩欧美一区二区 | 淫片一级国产 | 国产精品免费观看视频 | 中文字幕av在线一二三区 | 亚洲国产视频一区二区 | 欧美一级片在线看 | 男人天堂99 | 欧美日韩1区2区3区 欧美久久一区 | 久久视频精品 | 亚洲+变态+欧美+另类+精品 | 日韩看片| 久久久久久国产精品久久 | 亚洲欧美日韩电影 | 91亚洲免费 | 自拍偷拍在线视频 | 亚洲成人国产 | 国产一区免费 | 国产精品自产拍 | 啪视频在线 |