成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

觀點:流式計算推動實時處理商業(yè)變革

云計算
隨著大量實時計算需求的增加,分布式流式計算將會成為分布式計算的下一個主要研究重點,將會成為類似Hadoop這類MapReduce框架的有力補充。

 

[[54978]]

在這一年,我們看到眾多廠商工作重點主要是圍繞整合Hadoop或NoSQL數(shù)據(jù)處理引擎以及改善基本的數(shù)據(jù)存儲。Hadoop最成功的一點就是其采用了MapReduce。MapReduce是一種處理超大型數(shù)據(jù)集并生成相關(guān)執(zhí)行的編程模型,MapReduce的核心思想主要是借鑒了函數(shù)是編程語言以及矢量變成語言里的特性。

現(xiàn)今包括Microsoft、IBM、Oracle、Cloudera、MapR等眾多廠商相繼推出了與自身相結(jié)合的Hadoop產(chǎn)品。例如Oracle NoSQL Database,其是Oracle在全球大會上發(fā)布的Big Data Appliance的其中一個組件,Big Data Appliance還包括了Hadoop、Oracle數(shù)據(jù)庫Hadoop適配器、Oracle數(shù)據(jù)庫Hadoop裝載器及R語言的系統(tǒng)。

同時在本月微軟也公布了針對Windows Azure的基于Apache Hadoop的預(yù)覽發(fā)行版,據(jù)微軟透露其可使Hadoop應(yīng)用程序在幾小時即可部署完成,而以往這需要數(shù)天。而這種趨勢在未來一年還會持續(xù)下去。正如我們所看到的,Hadoop技術(shù)在眾多領(lǐng)域正廣泛得到部署。

 

[[54979]]

但Hadoop也面臨一些相當(dāng)棘手的狀況,眾所周知,Hadoop的批量化處理是人們喜愛它的地方,但這在某些領(lǐng)域仍顯不足,尤其是在例如移動、Web客戶端或金融、網(wǎng)頁廣告等需要實時計算的領(lǐng)域。這些領(lǐng)域產(chǎn)生的數(shù)據(jù)量極大,沒有足夠的存儲空間來存儲每個業(yè)務(wù)收到的數(shù)據(jù)。而流計算則可以實時對數(shù)據(jù)進行分析,并決定是否拋棄無用的數(shù)據(jù),而這無需經(jīng)過Map/Reduce的環(huán)節(jié)。

從實時計算的角度看,Yahoo!的分布式流計算平臺S4則要比Hadoop更具優(yōu)勢。MapReduce系統(tǒng)主要解決的是對靜態(tài)數(shù)據(jù)的批量處理,即當(dāng)前的MapReduce系統(tǒng)實現(xiàn)啟動計算時,一般數(shù)據(jù)已經(jīng)到位(比如保存到了分布式文件系統(tǒng)上)。

而流式計算系統(tǒng)在啟動時,一般數(shù)據(jù)并沒有完全到位,而是源源不斷地流入,并且不像批處理系統(tǒng)重視的是總數(shù)據(jù)處理的吞吐,而是對數(shù)據(jù)處理的latency,即希望進入的數(shù)據(jù)越快處理越好。

 

 

Yahoo!S4的設(shè)計大量借鑒了IBM的Stream Processing Core(SPC)中間件的設(shè)計。只是SPC采用的是Subscription Model,而S4結(jié)合了MapReduce和Actors Model。而簡單的編程接口;高可用+高可擴展;盡力避免Disk IO,盡量使用Local Memory,以便減少處理latency;使用去中心化和對稱架構(gòu),所有的節(jié)點的責(zé)任相同,方便部署和維護;功能可插拔,使得平臺通用化的同時,做到可以定制化以及設(shè)計要科學(xué)、易用和靈活是Yahoo!S4的設(shè)計目標(biāo)。

而Storm作為Twitter公司實時數(shù)據(jù)處理平臺也受到廣泛關(guān)注(Twitter也在9月19日圣路易斯市舉行的Strange Loop會議上公布其源代碼)。Storm的發(fā)展勢頭相當(dāng)強勁,Twitter開發(fā)的相應(yīng)工具已使其功能變得更加強大。

Storm的作用主要在以下三個領(lǐng)域:信息流處理(Stream processing)Storm可用來實時處理新數(shù)據(jù)和更新數(shù)據(jù)庫,兼具容錯性和可擴展性;連續(xù)計算(Continuous computation)Storm可進行連續(xù)查詢并把結(jié)果即時反饋給客戶端。比如把Twitter上的熱門話題發(fā)送到瀏覽器中;分布式遠程程序調(diào)用(Distributed RPC)Storm可用來并行處理密集查詢。Storm的拓撲結(jié)構(gòu)是一個等待調(diào)用信息的分布函數(shù),當(dāng)它收到一條調(diào)用信息后,會對查詢進行計算,并返回查詢結(jié)果。舉個例子Distributed RPC可以做并行搜索或者處理大集合的數(shù)據(jù)。

 

[[54981]]

另一個知名的分布式流式系統(tǒng)是Brandeis University、Brown University和MIT合作開發(fā)的Borealis,Borealis由之前的流式系統(tǒng)Aurora、Medusa演化而來。目前Borealis系統(tǒng)已經(jīng)停止維護,***的Release版本停止在2008年。

Borealis具有豐富的論文、完整的用戶/開發(fā)者文檔,系由是C++實現(xiàn)并運行于x86-based Linux平臺。同時系統(tǒng)是開源的,且使用了較多的第三方開源組件,包括用于查詢語言翻譯的ANTLR、C++的網(wǎng)絡(luò)編程框架庫NMSTL等。

Borealis系統(tǒng)的流式模型和其他流式系統(tǒng)基本一致:接受多元的數(shù)據(jù)流和輸出,為了容錯,采用確定性計算,對于容錯性要求高的系統(tǒng),會對輸入流使用算子進行定序。

隨著大量實時計算需求的增加,分布式流式計算將會成為分布式計算的下一個主要研究重點,將會成為類似Hadoop這類MapReduce框架的有力補充。

 

責(zé)任編輯:鳶瑋 來源: CSDN
相關(guān)推薦

2017-08-31 16:36:26

2015-06-15 09:45:36

聯(lián)想互聯(lián)網(wǎng)

2013-07-23 15:58:30

技術(shù)

2017-11-21 14:14:04

PHPnode.js圖片訪問

2017-08-09 13:30:21

大數(shù)據(jù)Apache Kafk實時處理

2019-09-04 09:31:40

日志Flink監(jiān)控

2022-10-14 14:48:57

2021-10-28 16:37:31

邊緣計算醫(yī)療保健云技術(shù)

2014-12-15 09:32:17

StormSpark

2025-03-04 08:00:00

JavaiTextPDFPDF

2017-02-14 15:37:32

KappaLambda

2016-03-23 18:04:08

中國網(wǎng)

2013-04-27 12:18:58

大數(shù)據(jù)全球技術(shù)峰會京東

2017-11-03 15:05:56

Storm數(shù)據(jù)處理服務(wù)器

2023-08-18 09:29:59

Java數(shù)據(jù)流

2020-09-18 10:30:23

5G

2014-03-25 12:04:37

IBM論壇云計算商業(yè)模式

2017-09-22 19:55:43

聯(lián)想超融合

2012-07-26 13:48:32

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 91精品国产综合久久婷婷香蕉 | 成人在线观看免费视频 | 久久久久亚洲视频 | 亚洲高清在线 | 亚洲成人一区二区 | 中文字幕在线视频免费视频 | av片毛片 | 色播久久 | 午夜精品久久久久久久久久久久久 | 一区欧美| 日韩黄a | 成人在线免费视频 | 欧美日韩国产一区二区三区 | 亚洲性视频网站 | 欧美日韩高清在线一区 | 亚洲精品国产电影 | 色视频欧美 | 六月婷婷久久 | 精品av| 自拍偷拍第一页 | 欧美福利网站 | 久久久观看 | 精品一区国产 | 国产精品久久久久国产a级 欧美日本韩国一区二区 | 999久久久久久久 | 18成人在线观看 | 久久久久久毛片免费观看 | 日本亚洲欧美 | 青青草综合 | 精品美女视频在免费观看 | 男人电影天堂 | 一区二区三区免费 | 国产网站在线免费观看 | 中文字幕视频在线看 | 在线视频日韩 | 日韩中文一区二区 | 亚洲iv一区二区三区 | 日韩av在线一区二区 | 在线看片国产 | 天天操网| 精品国产乱码久久久久久丨区2区 |