成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Spark 和 Hadoop 是朋友不是敵人

大數(shù)據(jù) Hadoop Spark
6月15日,IBM 宣布計(jì)劃大規(guī)模投資 Spark 相關(guān)技術(shù),此項(xiàng)聲明會(huì)促使越來(lái)越多的工程師學(xué)習(xí) Spark 技術(shù),并且大量的企業(yè)也會(huì)采用 Spark 技術(shù)。

 

6月15日,IBM 宣布計(jì)劃大規(guī)模投資 Spark 相關(guān)技術(shù),此項(xiàng)聲明會(huì)促使越來(lái)越多的工程師學(xué)習(xí) Spark 技術(shù),并且大量的企業(yè)也會(huì)采用 Spark 技術(shù)。

Spark 投資的良性循環(huán)會(huì)使 Spark 技術(shù)發(fā)展更加成熟,并且可以從整個(gè)大數(shù)據(jù)環(huán)境中獲益。然而,Spark 的快速增長(zhǎng)給人們一個(gè)奇怪且固執(zhí)的誤解:Spark 將取代 Hadoop,而不是作為 Hadoop 的補(bǔ)充。這樣的誤解可以從類似“旨在比下 Hadoop 的新軟件”和“企業(yè)將放棄大數(shù)據(jù)技術(shù) Hadoop”的標(biāo)題中看出來(lái)。

作為一個(gè)長(zhǎng)期的大數(shù)據(jù)實(shí)踐者,雅虎投資 Hadoop 的早期倡導(dǎo)者,一個(gè)為企業(yè)提供大數(shù)據(jù)服務(wù)的公司的 CEO ,我想在這篇文章中提出幾個(gè)明確的觀點(diǎn)。

Spark 和 Hadoop 會(huì)和諧相處。

越來(lái)越多的企業(yè)選擇 Hadoop 做大數(shù)據(jù)平臺(tái),而 Spark 是運(yùn)行于 Hadoop 頂層的內(nèi)存處理方案。Hadoop ***的用戶 —— 包括 eBay 和雅虎 —— 都在 Hadoop 集群中運(yùn)行著 Spark。Cloudera 和 Hortonworks 將 Spark 列為他們 Hadoop 發(fā)行的一部分。自從我們推出 Spark 之后,用戶一直在使用著 Spark。

將 Spark 置于和 Hadoop 對(duì)立的位置,就好像是說(shuō)你的新電動(dòng)汽車看起來(lái)很高級(jí),所以你的車就不需要充電一樣。如果電動(dòng)汽車真的普及的話,那只會(huì)帶來(lái)更多的用電需求。

為什么這么迷惑呢?現(xiàn)在的 Hadoop 包括兩個(gè)主要的組件。***個(gè)是大規(guī)模儲(chǔ)存系統(tǒng),叫做 Hadoop Distributed File System (HDFS),它以低功耗、高性能的方式儲(chǔ)存數(shù)據(jù),并且能優(yōu)化大數(shù)據(jù)的種類和讀取速度。第二個(gè)是一個(gè)計(jì)算引擎,叫做 YARN,它能在儲(chǔ)存在 HDFS 上的數(shù)據(jù)頂層運(yùn)行大規(guī)模并行程序。

YARN 可以承載任何數(shù)量的程序框架。原始的框架是 MapReduce,它由谷歌發(fā)明,用于處理大規(guī)模頁(yè)面抓取。Spark 是另一個(gè)類似的框架,另一個(gè)新的框架叫做 Tez。當(dāng)人們談?wù)?Spark“干掉”Hadoop 時(shí),他們往往指的是程序員更喜歡將 Spark 用在老的 MapReduce 框架上。

然而,MapReduce 不等同于 Hadoop。MapReduce 只是 Hadoop 集群處理數(shù)據(jù)的多種方式之一。Spark 可以是替代品。說(shuō)得更寬點(diǎn),商業(yè)分析師 —— 持續(xù)增長(zhǎng)的大數(shù)據(jù)從業(yè)者 —— 會(huì)避免使用這兩個(gè)對(duì)于程序員來(lái)說(shuō)十分低端的框架。相反,他們會(huì)使用更高級(jí)的語(yǔ)言,例如 SQL ,來(lái)讓 Hadoop 更容易訪問(wèn)。

在過(guò)去的四年中,基于 Hadoop 的大數(shù)據(jù)技術(shù)達(dá)到了***的創(chuàng)新水平。我們已經(jīng)從 SQL 批處理轉(zhuǎn)向互動(dòng):從單一框架(MapReduce)轉(zhuǎn)到多框架(MapReduce、Spark 等等)。

我們已經(jīng)看到了 HDFS 優(yōu)異的性能和安全性的改善,并且我們還看到了頂層工具的井噴 , 例如 Datameer、H20Tableau。大量不同領(lǐng)域的數(shù)據(jù)科學(xué)家和商業(yè)用戶使這些大數(shù)據(jù)工具變得更為易用。

Spark 對(duì)于 Hadoop 來(lái)說(shuō)不是挑戰(zhàn),也不是來(lái)取代 Hadoop 的。相反,Hadoop 是 Spark 成長(zhǎng)發(fā)展的基礎(chǔ)。我們希望兩個(gè)組織都能有長(zhǎng)足的發(fā)展,并且成為將數(shù)據(jù)資產(chǎn)轉(zhuǎn)化為可執(zhí)行商業(yè)計(jì)劃的最有活力的平臺(tái)。

 
責(zé)任編輯:王雪燕 來(lái)源: TechCrunch
相關(guān)推薦

2010-05-11 17:09:52

Google蘋果

2009-08-10 10:14:50

思科錢伯斯

2023-07-18 15:04:51

2024-06-13 13:13:52

2010-01-28 09:54:29

喬布斯

2015-07-23 14:29:28

大數(shù)據(jù)sparkhadoop

2016-03-09 14:35:42

HadoopSpark數(shù)據(jù)處理

2015-06-12 10:39:07

數(shù)據(jù)中心

2018-01-22 08:33:28

SparkHadoop計(jì)算

2014-04-15 10:46:38

CIOCSO企業(yè)安全

2021-09-08 15:02:28

人工智能AIRFID

2018-05-10 09:51:39

Spark內(nèi)存Hadoop

2019-07-17 13:25:03

SparkHadoop架構(gòu)

2017-03-06 09:40:39

OpenStack SHadoopSpark

2021-12-14 09:56:51

HadoopSparkKafka

2021-09-06 08:50:49

服務(wù)Dubbo參數(shù)

2024-07-18 15:03:56

2017-04-19 11:17:48

SparkHadoopMapReduce

2016-02-26 10:20:17

HadoopSpark大數(shù)據(jù)項(xiàng)目

2013-12-19 09:42:34

程序員趣聞
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产乱精品一区二区三区 | 亚洲视频一区二区三区 | 老外黄色一级片 | 亚洲综合一区二区三区 | 日韩在线视频一区 | 国内精品久久影院 | 亚洲精品乱码久久久久久9色 | 亚洲精品一区国语对白 | 色香婷婷| 亚洲成人999 | 国产精品久久久久久久久久久久冷 | 中文字幕日本一区二区 | a视频在线 | 国产成人精品免费视频大全最热 | 日韩色图视频 | 欧美三区在线观看 | 欧美日韩综合 | 污片在线观看 | 91在线网站| 久久久久91| 国产乱码精品一区二区三区忘忧草 | 久久久久久久国产 | 欧美日韩国产一区二区三区 | 麻豆久久久久 | 黄色网页在线观看 | 国产精品欧美一区二区三区 | 正在播放国产精品 | 色视频成人在线观看免 | 日本韩国欧美在线观看 | 在线成人av | 黄色一级大片在线免费看产 | 国产精品免费一区二区三区四区 | 国产精品欧美日韩 | www.99精品| 搞黄视频免费看 | 国产精品视频一区二区三区不卡 | 日韩毛片视频 | 日韩中文一区 | 99热精品久久 | 午夜私人影院在线观看 | 亚洲欧洲日韩精品 中文字幕 |