成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

面試系列:深入理解Hadoop架構(gòu)體系

大數(shù)據(jù) Hadoop
Hadoop架構(gòu)體系面試題:HDFS的進(jìn)程構(gòu)成及其作用;nameNode進(jìn)程:負(fù)責(zé)對(duì)外展示文件的層級(jí)結(jié)構(gòu)、管理客戶端對(duì)文件的訪問(wèn)(如:打開(kāi)、關(guān)閉、重命名等)、決定文件block與dataNode的對(duì)應(yīng)關(guān)系等。

Hadoop組件簡(jiǎn)介

官方文檔組織的非常清晰,主要由以下四個(gè)組件組成:HDFS、map-reduce、yarn、hadoop-common 

面試系列:深入理解hadoop架構(gòu)體系
hdfs架構(gòu)

HDFS

分布式文件存儲(chǔ)系統(tǒng),主要特點(diǎn)是:

  • 可以運(yùn)行在普通低成本硬件之上
  • 并且具備高容錯(cuò)性(硬件容錯(cuò))
  • 適合高吞吐量的大數(shù)據(jù)存儲(chǔ),但并不強(qiáng)調(diào)低延遲
  • 適合一次寫,多次讀的場(chǎng)景,不支持隨機(jī)讀寫;

map-reduce

map-reduce是一個(gè)計(jì)算框架,絕大部分的數(shù)據(jù)處理都可以轉(zhuǎn)化為map、reduce組合,然后利用map-reduce框架進(jìn)行計(jì)算、處理;

yarn

資源管理器,核心的思想時(shí)將資源的調(diào)度管理與資源監(jiān)控分割為兩個(gè)進(jìn)程,其中一個(gè)是ResourceManager,另一個(gè)是NodeManager,前者負(fù)責(zé)資源的分配、后者負(fù)責(zé)資源監(jiān)控; 

面試系列:深入理解hadoop架構(gòu)體系

common

hdfs、map-reduce所需要的公共庫(kù);

面試題

  • HDFS的進(jìn)程構(gòu)成及其作用;
  • nameNode進(jìn)程:負(fù)責(zé)對(duì)外展示文件的層級(jí)結(jié)構(gòu)、管理客戶端對(duì)文件的訪問(wèn)(如:打開(kāi)、關(guān)閉、重命名等)、決定文件block與dataNode的對(duì)應(yīng)關(guān)系;
  • secondNameNode進(jìn)程:從名字來(lái)看,應(yīng)該是nameNode的back up,然而并不是,其主要作用是協(xié)助nameNode管理editLog;
  • dataNode:主要負(fù)責(zé)數(shù)據(jù)存儲(chǔ)以及客戶端的讀寫請(qǐng)求以及block的創(chuàng)建、刪除等;

詳細(xì)解釋map過(guò)程的細(xì)節(jié):

  • map過(guò)程主要是實(shí)現(xiàn)key-value集合到key-value集合的映射,可以實(shí)一對(duì)一、一對(duì)多、多對(duì)多映射;
  • 詳細(xì)過(guò)程是:map -> group -> sorted -> partitioned
  • group:相同的key放到一起;
  • sorted:按照key進(jìn)行排序
  • partition:對(duì)key進(jìn)行分區(qū),最終分區(qū)數(shù)量一般等于task數(shù)量;

詳細(xì)解釋reduce過(guò)程細(xì)節(jié):

  • 首先是shuffle,即從map端拉取數(shù)據(jù)到reducer端;
  • 之后是group,也就是相同的key可能來(lái)自于不同的map,所以需要group
  • 之后是sort過(guò)程(再map階段排序的基礎(chǔ)之上,進(jìn)行歸并排序即可)
  • 最后是second sort(用戶自定義,如果沒(méi)有自定義則不執(zhí)行)
  • 最后是reduce過(guò)程。 
面試系列:深入理解hadoop架構(gòu)體系

setCombinerClass的作用:

  • 在map端先進(jìn)行一部分reduce工作,主要優(yōu)點(diǎn)是減少shuffle成本;但也有一定的局限性,僅僅適用于reduce的輸入和輸出數(shù)據(jù)類型相同時(shí);

簡(jiǎn)單介紹Federation架構(gòu):

  • Federation架構(gòu)通過(guò)多個(gè)獨(dú)立的NameNode實(shí)現(xiàn)集群的橫向擴(kuò)展,主要解決了HDFS的吞吐量及承載量受限于單個(gè)nameNode,并且無(wú)法根據(jù)namespace做隔離的弊端。

在存儲(chǔ)層,各個(gè)nameNode共用統(tǒng)一的DataNode

 

責(zé)任編輯:未麗燕 來(lái)源: 今日頭條
相關(guān)推薦

2018-12-27 12:34:42

HadoopHDFS分布式系統(tǒng)

2021-09-03 09:55:43

架構(gòu)Yarn內(nèi)部

2021-09-28 09:26:04

云計(jì)算OpenAPI體系

2017-08-15 13:05:58

Serverless架構(gòu)開(kāi)發(fā)運(yùn)維

2012-08-31 10:00:12

Hadoop云計(jì)算群集網(wǎng)絡(luò)

2012-11-08 14:47:52

Hadoop集群

2013-07-31 10:04:42

hadoopHadoop集群集群和網(wǎng)絡(luò)

2023-06-07 15:34:21

架構(gòu)層次結(jié)構(gòu)

2018-04-16 11:04:23

HBaseRegion Serv數(shù)據(jù)庫(kù)

2022-01-14 12:28:18

架構(gòu)OpenFeign遠(yuǎn)程

2019-03-18 09:50:44

Nginx架構(gòu)服務(wù)器

2024-10-28 08:28:59

2010-06-01 15:25:27

JavaCLASSPATH

2016-12-08 15:36:59

HashMap數(shù)據(jù)結(jié)構(gòu)hash函數(shù)

2020-07-21 08:26:08

SpringSecurity過(guò)濾器

2023-01-16 18:32:15

架構(gòu)APNacos

2020-09-23 10:00:26

Redis數(shù)據(jù)庫(kù)命令

2019-06-25 10:32:19

UDP編程通信

2017-01-10 08:48:21

2024-02-21 21:14:20

編程語(yǔ)言開(kāi)發(fā)Golang
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产精品久久国产愉拍 | 一区二区三区视频在线 | 亚洲国产成人精品女人久久久 | 男人的天堂中文字幕 | www.com久久久 | a在线视频观看 | 日韩在线电影 | 日韩一区二区久久 | 久久免费视频2 | 蜜桃视频一区二区三区 | 国产欧美精品一区二区 | 福利影院在线看 | 亚洲精选一区二区 | 国产精品久久久久aaaa九色 | 久久69精品久久久久久久电影好 | 国产在线高清 | 日韩中文字幕第一页 | 国产精品一区二区三区在线 | 97视频免费 | 国产精品地址 | 久久亚洲综合 | 91看片视频 | 欧洲色 | 国产一区二区久久 | 国产精品一区二区三区久久 | 视频精品一区二区三区 | 美女视频一区二区三区 | 国产91丝袜在线播放 | 精品国产一区二区三区久久久蜜月 | 中文字幕一区二区三区精彩视频 | 久久宗合色 | 一区二区三区视频在线观看 | 国内av在线 | 亚洲精品国产偷自在线观看 | 99免费在线| 男女污污网站 | 欧美激情视频一区二区三区在线播放 | 成人做爰www免费看视频网站 | 国产精品亚洲精品日韩已方 | 男女在线免费观看 | 一区二区三区视频在线 |