成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

讓你的Hadoop運(yùn)行的更快

云計(jì)算 Hadoop
目前,在數(shù)據(jù)處理上,我們輸入數(shù)據(jù)的速度往往比我們處理數(shù)據(jù)的速度快得多。在大數(shù)據(jù)的環(huán)境下,這個(gè)問題正變得更加明顯。針對(duì)這個(gè)問題,GigaSpaces的CTO和創(chuàng)始人Nati Shalom日前在他的博客中介紹了如何讓Hadoop的速度更快的相關(guān)技術(shù)。

 目前,在數(shù)據(jù)處理上的一個(gè)挑戰(zhàn)是,我們輸入數(shù)據(jù)的速度往往比我們處理數(shù)據(jù)的速度快得多。在大數(shù)據(jù)的環(huán)境下,隨著數(shù)據(jù)量的繼續(xù)增長,以及相應(yīng)的需要更多的復(fù)雜的數(shù)據(jù)處理,這個(gè)問題正變得更加明顯。

幫助批處理

Hadoop的目的是通過以下幾種方式應(yīng)對(duì)這一挑戰(zhàn):

1. 使用一個(gè)分布式的文件系統(tǒng):這使我們能夠分散負(fù)載,并根據(jù)需要壯大我們的系統(tǒng)。

2. 優(yōu)化寫入速度:為了能夠快速寫入設(shè)計(jì)的Hadoop架構(gòu),需要在第一次登錄時(shí)寫入并處理。這可讓寫入速度相當(dāng)快。

3. 使用批處理(Map/Reduce)來用處理速度平衡數(shù)據(jù)饋送的速度

批處理的挑戰(zhàn)

批量處理所面臨的挑戰(zhàn)是它假定數(shù)據(jù)量突然增加。如果我們的數(shù)據(jù)在一個(gè)連續(xù)的基礎(chǔ)上穩(wěn)定到來,那么假設(shè)將導(dǎo)致整個(gè)批量處理背后的架構(gòu)開始崩潰。

如果我們增加了批處理窗口,結(jié)果是在數(shù)據(jù)到來的這段時(shí)間里的更高的延遲,直到我們真正得到它并納入我們的報(bào)告和見解里。此外,在許多系統(tǒng)中,每天進(jìn)行的批處理窗口時(shí)間是有限的。通常情況下,假設(shè)大部分的處理可以在非高峰時(shí)段來進(jìn)行,但是,體積變大,處理的數(shù)據(jù)所花費(fèi)的時(shí)間變長,直到有一天它達(dá)到時(shí)間極限,然后我們面臨處理一個(gè)不斷增長的積壓的問題。此外,如果我們的處理過程發(fā)生失敗,我們可能沒有足夠的時(shí)間來重新處理。

通過基于流的處理來加快速度

基于流的處理概念是相當(dāng)簡單的。我們可以在數(shù)據(jù)進(jìn)來的同時(shí)處理它,而不是先記錄再處理。

用生產(chǎn)線這個(gè)很好的比喻來解釋其中的差別。想想一家汽車制造線:一種方法是把所有的部件放在一起,然后一件一件地組裝;另一種方法是讓制造商包裝各個(gè)部件,并只發(fā)送包裝好的部件到制造線上。哪種方法更快?

Hadoop批處理系統(tǒng)和制造業(yè)的生產(chǎn)線是一樣的道理。

在制造業(yè)中,即使我們在制造商那里預(yù)先包裝零部件,我們?nèi)匀恍枰阉械牟考黄鸾M裝起來。同樣的道理,基于流的處理并不意味著要取代我們的Hadoop系統(tǒng),而是減少系統(tǒng)需要處理的大量工作,并讓進(jìn)入Hadoop的過程變得更容易,從而讓數(shù)據(jù)處理更快。

內(nèi)存中的流處理可以成為一個(gè)很好的流處理系統(tǒng)。在這個(gè)案例中,對(duì)于大數(shù)據(jù)的實(shí)時(shí)分析的背景下如何工作,我們演示了Twitter使用基于流的處理來面對(duì)到來的數(shù)據(jù),然后送入一個(gè)大數(shù)據(jù)資料庫。如下圖所示:

 

 

最后的注意事項(xiàng)

我們可以在一些工作進(jìn)入我們的Hadoop系統(tǒng)之前就進(jìn)行預(yù)處理,這樣使我們的Hadoop系統(tǒng)運(yùn)行得更快。我們也可以不在Hadoop Map/Reduce系統(tǒng)中批處理不適合的工作負(fù)載,而是使用Stream Processing。

責(zé)任編輯:王程程 來源: CSDN
相關(guān)推薦

2024-10-08 10:24:41

Python編程語言

2012-09-11 09:16:52

Hadoop

2015-06-25 10:06:31

PHP 7GCC PGO

2015-06-23 15:17:57

PHPGCCPGO

2023-12-13 08:28:07

2024-01-08 17:09:07

Python解釋器CPython

2017-02-06 15:54:42

Windows 10Windows Def電腦

2011-07-06 10:27:32

ADSL

2011-07-06 10:48:12

ADSL

2022-01-06 22:31:21

Python技巧代碼

2011-07-06 10:48:42

ADSL

2012-06-15 14:02:51

火狐設(shè)置

2014-08-28 09:35:32

Node.js前端開發(fā)

2012-09-20 11:23:18

Hadoop云計(jì)算

2023-09-13 09:44:32

GLIBC系統(tǒng)

2009-11-13 08:53:01

Windows 7BIOS優(yōu)化

2013-05-09 15:39:30

Hadoop集群分布式

2012-12-27 17:43:11

應(yīng)用商店開發(fā)者

2018-01-03 09:09:09

數(shù)據(jù)庫速度技巧

2009-11-11 08:58:59

Windows 7系統(tǒng)加速
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: www.一级毛片 | 99reav| 韩国主播午夜大尺度福利 | 亚洲视频在线观看免费 | 国产欧美一级 | 成人一区二区三区在线观看 | 日韩精品免费 | 欧美国产精品一区二区三区 | 亚洲精品久久久蜜桃网站 | 久久综合色综合 | 欧美日本韩国一区二区 | 香蕉视频在线播放 | 成人午夜免费视频 | 日韩在线观看 | 欧洲在线视频 | 91精品一区二区三区久久久久 | 国产视频中文字幕 | 成人影院网站ww555久久精品 | 一级毛片在线播放 | 国产在线一区二区 | 色秀网站| 午夜影院普通用户体验区 | 欧美成人一区二免费视频软件 | 嫩草研究影院 | 国产一区二区三区高清 | 日韩精品无码一区二区三区 | 成人深夜福利在线观看 | 一区二区三区在线电影 | 爱爱免费视频 | 色婷婷av777 av免费网站在线 | 成人精品在线观看 | 欧美国产91 | 草草视频在线免费观看 | 久久精品色欧美aⅴ一区二区 | 成av在线| 男女黄网站 | 久久蜜桃av一区二区天堂 | 一区中文字幕 | 免费a在线| 九九热国产视频 | 亚洲精品一区二区另类图片 |