成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop學習筆記之Hadoop的來龍去脈

數據庫 Hadoop
其實,Hadoop并不僅僅是一個用于存儲的分布式文件系統,而是設計用來在由通用計算設備組成的大型集群上執行分布式應用的框架。

談到Hadoop就不得不提到Lucene和Nutch。首先,Lucene并不是一個應用程序,而是提供了一個純Java的高性能全文索引引擎工具包,它可以方便的嵌入到各種實際應用中實現全文搜索/索引功能。Nutch是一個應用程序,是一個以Lucene為基礎實現的搜索引擎應用,Lucene 為Nutch提供了文本搜索和索引的API,Nutch不光有搜索的功能,還有數據抓取的功能。在nutch0.8.0版本之前,Hadoop還屬于 Nutch的一部分,而從nutch0.8.0開始,將其中實現的NDFS和MapReduce剝離出來成立一個新的開源項目,這就是Hadoop,而 nutch0.8.0版本較之以前的Nutch在架構上有了根本性的變化,那就是完全構建在Hadoop的基礎之上了。在Hadoop中實現了 Google的GFS和MapReduce算法,使Hadoop成為了一個分布式的計算平臺。

其實,Hadoop并不僅僅是一個用于存儲的分布式文件系統,而是設計用來在由通用計算設備組成的大型集群上執行分布式應用的框架。

Hadoop包含兩個部分:

1、HDFS

即Hadoop Distributed File System (Hadoop分布式文件系統)

HDFS具有高容錯性,并且可以被部署在低價的硬件設備之上。HDFS很適合那些有大數據集的應用,并且提供了對數據讀寫的高吞吐率。 HDFS是一個master/slave的結構,就通常的部署來說,在master上只運行一個Namenode,而在每一個slave上運行一個 Datanode。

HDFS支持傳統的層次文件組織結構,同現有的一些文件系統在操作上很類似,比如你可以創建和刪除一個文件,把一個文件從一個目錄移到另一個目錄,重命名等等操作。Namenode管理著整個分布式文件系統,對文件系統的操作(如建立、刪除文件和文件夾)都是通過Namenode來控制。

2、MapReduce的實現

MapReduce是Google 的一項重要技術,它是一個編程模型,用以進行大數據量的計算。對于大數據量的計算,通常采用的處理手法就是并行計算。至少現階段而言,對許多開發人員來說,并行計算還是一個比較遙遠的東西。MapReduce就是一種簡化并行計算的編程模型,它讓那些沒有多少并行計算經驗的開發人員也可以開發并行應用。

MapReduce的名字源于這個模型中的兩項核心操作:Map和 Reduce。也許熟悉Functional Programming(函數式編程)的人見到這兩個詞會倍感親切。簡單的說來,Map是把一組數據一對一的映射為另外的一組數據,其映射的規則由一個函數來指定,比如對[1, 2, 3, 4]進行乘2的映射就變成了[2, 4, 6, 8]。Reduce是對一組數據進行歸約,這個歸約的規則由一個函數指定,比如對[1, 2, 3, 4]進行求和的歸約得到結果是10,而對它進行求積的歸約結果是24。

關于MapReduce的內容,建議看看這篇文章MapReduce:The Free Lunch Is Not Over!

持續學習中....Hurry

【編輯推薦】

  1. 數據挖掘中易犯的幾大錯誤
  2. 整理索引碎片,提升SQL Server速度
  3. 大數據平臺:探索數據價值
  4. Big Data技術綜述
責任編輯:艾婧 來源: Hurry的專欄
相關推薦

2017-10-19 15:34:52

Hadoop技術機制學習

2010-06-03 11:12:55

Hadoop

2010-06-03 11:34:42

Hadoop

2010-06-04 18:17:50

Hadoop集群

2018-07-11 13:33:43

大數據人工智能Hadoop

2010-06-04 09:43:47

hadoop應用

2010-06-07 16:34:07

Hadoop0.20.

2017-10-23 14:14:26

HadoopHadoop HAQJM

2010-06-07 15:33:42

Hadoop0.20更

2015-08-19 14:43:19

pighadoop

2019-09-23 13:03:42

NameNode元數據文件

2014-11-10 15:02:21

大數據云計算Hadoop

2013-10-15 10:24:23

hadoop大數據

2013-10-15 10:18:17

2018-07-10 15:15:11

2014-11-11 10:47:19

hadoop數據流

2010-06-04 10:01:26

Hadoop安裝

2016-12-20 18:21:29

Hadoop大數據面試

2010-05-24 14:59:29

Hadoop集群

2019-07-10 09:21:36

大數據數據庫Hadoop
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一级黄色毛片免费 | 国产视频一二三区 | 91视频久久久久 | 国产精品久久久久久久免费大片 | 久久只有精品 | www.99热这里只有精品 | 羞羞视频网站免费观看 | 成人三级影院 | 国产精品久久久久久婷婷天堂 | 欧美精品一区二区三区蜜臀 | 欧美色综合一区二区三区 | 亚洲综合色 | 97久久精品午夜一区二区 | 国产激情视频网址 | 性高朝久久久久久久3小时 av一区二区三区四区 | 久草在线在线精品观看 | 欧美激情一区 | 国产特级毛片aaaaaa喷潮 | av黄色在线| 日干夜干 | 黄色片在线观看网址 | 九九综合 | 久久久亚洲一区 | 午夜精品91 | 欧美乱人伦视频 | 欧美一区二区黄 | 久久精品色欧美aⅴ一区二区 | a级在线| 久久久精品视频免费看 | 精品中文字幕在线观看 | 国产高清视频在线播放 | 国产福利视频导航 | 蜜桃视频一区二区三区 | 日韩小视频在线 | 精品国产91| 日本高清中文字幕 | 国产日韩免费视频 | 亚洲精品视频网站在线观看 | 91精品久久久久 | 欧美日韩视频在线播放 | 亚洲444kkkk在线观看最新 |