成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大數據三大主流平臺框架的比較

大數據
大數據框架能夠實現對海量數據的整合處理,大數據的三大主流框架有Hadoop,Spark以及Storm這三種。Hadoop因為具有良好的跨平臺性、對數據進行高效處理和其部署廉價性成為目前世界上使用最廣泛的大數據工具;SparkSpark具有更加高效和快速的計算能力;Storm具有實時實時處理流式數據的計算優勢,當然這三種框架也各自存在不足。本文對著三大主流框架進行比較,分析它們的優點和缺點。

 在大數據的處理上,起到關鍵性作用的就是大數據框架,通過大數據系統框架,實現對大規模數據的整合處理。從人工統計分析到計算機,再到今天的分布式計算平臺,數據處理速度飛速提高的背后是整體架構的不斷演進。當今,市面上可用的大數據框架很多,最流行的莫過于Hadoop,Spark以及Storm這三種了,Hadoop是主流,然而Spark和Storm這兩個后起之秀也正以迅猛之勢快速發展。接下來讓我們一起了解一下這三個平臺。

1、Hadoop

說到大數據,首先想到的肯定是Hadoop,因為Hadoop是目前世界上使用最廣泛的大數據工具。具有良好的跨平臺性,并且可部署在廉價的計算機集群中,在業內應用非常廣泛,是的代名詞,也是分布式計算架構的鼻祖。憑借極高的容錯率和極低的硬件價格,在大數據市場上蒸蒸日上。幾乎所有主流廠商都圍繞Hadoop進行開發和提供服務,如谷歌、百度、思科、華為、阿里巴巴、微軟都支持Hadoop。到目前為止,Hadoop已經成為一個巨大的生態系統,并且已經實現了大量的算法和組件。

 

Hadoop框架當中最主要的單個組件就是HDFS、MapReduce以及Yarn。

 

在大數據處理環節當中,HDFS負責數據存儲,MapReduce負責數據計算,Yarn負責資源調度。基于這三個核心組件,Hadoop可以實現對大規模數據的高效處理,同時Hadoop出色的故障處理機制,支持高可伸縮性,容錯能力,具有高可用性,更適合大數據平臺研發。

 

但是Hadoop存在比較大的一個局限就是,處理數據主要是離線處理,對于大規模離線數據處理很有一套,但是對于時效性要求很高的數據處理任務,不能實現很好的完成。


作為一種對大量數據進行分布式處理的軟件框架,Hadoop具有以下幾方面特點:


Hadoop架構大幅提升了計算存儲性能,降低計算平臺的硬件投入成本。但是由于計算過程放在硬盤上,受制于硬件條件限制,數據的吞吐和處理速度明顯不如使用內存快,尤其是在使用Hadoop進行迭代計算時,非常耗資源,且在開發過程中需要編寫不少相對底層的代碼,不夠高效。

 

2、Spark

基于Hadoop在實時數據處理上的局限,Spark與Storm框架應運而生,具有改進的數據流處理的批處理框架,通過內存計算,實現對大批量實時數據的處理,基于Hadoop架構,彌補了Hadoop在實時數據處理上的不足。為了使程序運行更快,Spark提供了內存計算,減少了迭代計算時的I/O開銷。Spark不但具備Hadoop MapReduce的優點,而且解決了其存在的缺陷,逐漸成為當今領域最熱門的計算平臺。

 

作為大數據框架的后起之秀,Spark具有更加高效和快速的計算能力,其特點主要有:


我們知道計算模式主要有四種,除了圖計算這種特殊類型,其他三種足以應付大部分應用場景,因為實際應用中處理主要就是這三種:復雜的批量數據處理、基于歷史數據的交互式查詢和基于實時數據流的數據處理。

 

Hadoop MapReduce主要用于計算,Hive和Impala用于交互式查詢,Storm主要用于流式數據處理。以上都只能針對某一種應用,但如果同時存在三種應用需求,Spark就比較合適了。因為Spark的設計理念就是“一個軟件棧滿足不同應用場景”,它有一套完整的生態系統,既能提供內存計算框架,也可支持多種類型計算(能同時支持、流式計算和交互式查詢),提供一站式解決方案。

 

此外,Spark還能很好地與Hadoop生態系統兼容,Hadoop應用程序可以非常容易地遷移到Spark平臺上。

除了數據存儲需借助Hadoop的HDFS或Amazon S3之外,其主要功能組件包括Spark Core(基本通用功能,可進行復雜的批處理計算)、Spark SQL(支持基于歷史數據的交互式查詢計算)、Spark Streaming(支持實時流式計算)、MLlib(提供常用機器學習,支持基于歷史數據的數據挖掘)和GraphX(支持圖計算)等。

 

盡管Spark有很多優點,但它并不能完全替代Hadoop,而是主要替代MapReduce計算模型。Spark沒有像Hadoop那樣有數萬個級別的集群,所以在實際應用中,Spark常與Hadoop結合使用,它可以借助YARN來實現資源調度管理,借助HDFS實現分布式存儲。此外,比起Hadoop可以用大量廉價計算機集群進行分布式存儲計算(成本低),Spark對硬件要求較高,成本也相對高一些。

 

3、Storm

與Hadoop的批處理模式不同,Storm使用一個流計算框架,該框架由Twitter開源,托管在GitHub上。與Hadoop相似,Storm也提出了兩個計算角色,Spout和Bolt。

 

如果說Hadoop是一個水桶,一次只能在一口井里裝一個水桶,那么Storm是一個水龍頭,它可以打開來連續生產水。Storm還支持許多語言,如Java、Ruby、Python等。因為Storm是一個流計算框架,它使用內存,這在延遲方面有很大優勢,但是Storm不會持久化數據。

 

但Storm的缺點在于,無論是離線、高延遲,還是交互式查詢,它都不如Spark框架。不同的機制決定了二者所適用的場景不同,比如炒股,股價的變化不是按秒計算的,因此適合采用計算延遲度為秒級的Spark框架;而在高頻交易中,高頻獲利與否往往就在1ms之間,就比較適合采用實時計算延遲度的Storm框架。

 

Storm對于實時計算的意義類似于Hadoop對于的意義,可以簡單、高效、可靠地處理流式數據并支持多種語言,它能與多種系統進行整合,從而開發出更強大的實時計算系統。

 

作為一個實時處理流式數據的計算框架,Storm的特點如下:


就像目前云計算市場中風頭最勁的混合云一樣,越來越多的組織和個人采用混合式大數據平臺架構,因為每種架構都有其自身的優缺點。

 

比如Hadoop,其數據處理速度和難易度都遠不如Spark和Storm,但是由于硬盤斷電后其數據可以長期保存,因此在處理需要長期存儲的數據時還需要借助于它。不過由于Hadoop具有非常好的兼容性,因此也非常容易同Spark和Storm相結合使用,從而滿足不同組織和個人的差異化需求。

 

考慮到網絡安全態勢所應用的場景,即大部分是復雜批量數據處理(日志事件)和基于歷史數據的交互式查詢以及數據挖掘,對準實時流式數據處理也會有一部分需求(如會話流的檢測分析),建議其大數據平臺采用Hadoop和Spark相結合的建設模式。

 

大數據處理的框架是一直在不斷更新優化的,沒有哪一種結構能夠實現對大數據的完美處理,在真正的大數據平臺開發上,需要根據實際需求來考量。

責任編輯:梁菲 來源: 職坐標在線
相關推薦

2024-12-27 10:20:54

2017-08-21 15:35:57

大數據云計算UE

2017-08-10 14:30:52

大數據數據采集架構分析

2016-01-28 10:26:59

大數據平臺大數據采集架構分析

2021-02-22 10:32:53

大數據大數據平臺大數據技術棧

2015-03-16 13:49:27

大數據大數據誤區大數據錯誤

2016-05-12 10:00:28

新華三

2018-03-15 09:53:48

大數據機器學習云服務

2021-12-14 09:56:51

HadoopSparkKafka

2017-02-22 07:22:51

2017-03-06 15:24:09

大數據交警交管平臺

2021-11-08 14:03:44

大數據數據分析技術

2011-07-19 09:35:46

.Net

2018-04-03 10:33:15

大數據

2017-09-06 17:05:54

大數據處理流程處理框架

2012-07-19 09:15:43

CloudStackEucalyptusvCloud Dire

2014-01-14 08:56:49

大數據大數據應用

2017-10-21 22:26:32

備份數據保護IT

2013-04-02 09:32:18

大數據分析大數據市場預測大數據全球技術峰會

2016-12-30 13:30:27

大數據區域鏈算法
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成年人在线视频 | 久久久久久国产精品 | 国产不卡一区在线观看 | 最新中文字幕久久 | 亚洲精品二区 | 在线不卡视频 | 青青草精品 | 成人一区二区三区在线观看 | 草草草久久久 | 一区二区在线不卡 | 国产精品jizz在线观看老狼 | 免费在线a视频 | 精品精品 | 亚洲精品电影在线观看 | 国产小视频在线 | 国产一区二区三区视频在线观看 | 国产韩国精品一区二区三区 | 亚洲一区二区在线 | 天堂一区 | 国产精品精品3d动漫 | 成人自拍av| 伊人久麻豆社区 | 在线视频91| 日韩欧美精品一区 | 嫩呦国产一区二区三区av | 久久成人一区 | 免费看黄视频网站 | 第一区在线观看免费国语入口 | 久久999| 久草中文在线 | 国内精品久久久久久影视8 最新黄色在线观看 | 国产9999精品| 99久久精品一区二区毛片吞精 | 一区二区在线视频 | 色www精品视频在线观看 | 欧美一区二区三区 | 91视视频在线观看入口直接观看 | 免费观看黄a一级视频 | www亚洲免费国内精品 | 国产日韩欧美另类 | 欧美一区二区激情三区 |