成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Twitter將采用Spark分析大數(shù)據(jù)

大數(shù)據(jù) Spark
Twitter數(shù)據(jù)科學(xué)家Edwin Chen最近在接受媒體采訪的時(shí)候透露,Twitter內(nèi)部希望嘗試一種全新的大數(shù)據(jù)系統(tǒng)——Spark。

 Spark是一個(gè)基于內(nèi)存計(jì)算的開源的集群計(jì)算系統(tǒng)(點(diǎn)此下載),目的是讓數(shù)據(jù)分析更加快速。Spark非常小巧玲瓏,由加州伯克利大學(xué)AMP實(shí)驗(yàn)室的Matei為主的小團(tuán)隊(duì)所開發(fā)。使用的語(yǔ)言是Scala,項(xiàng)目的core部分的代碼只有63個(gè)Scala文件,非常短小精悍。與Hadoop不同的是,Spark和Scala緊密集成,Scala像管理本地collective對(duì)象那樣管理分布式數(shù)據(jù)集。

Edwin認(rèn)為:”MapReduce或hadoop任務(wù)都是批處理,所以啟動(dòng)一項(xiàng)Hadoop任務(wù),或等待結(jié)果返回都需要等待很長(zhǎng)時(shí)間,這一點(diǎn)很難改變,因?yàn)镠adoop天生就是一個(gè)批處理系統(tǒng),你無(wú)法在上面運(yùn)行互動(dòng)分析。不過(guò)Hadoop對(duì)于分析海量數(shù)據(jù)還是很有用的。”

Spark開發(fā)之初是為了兩個(gè)能被內(nèi)存計(jì)算提速的應(yīng)用:互動(dòng)算法(常見于機(jī)器學(xué)習(xí)中,例如Google的PR)和互動(dòng)數(shù)據(jù)挖掘(Hive on Spark)。在這兩個(gè)應(yīng)用中,Spark的速度是Hadoop MapReduce的30倍!這是因?yàn)檫\(yùn)行Spark系統(tǒng)時(shí),服務(wù)器可以把中間數(shù)據(jù)存儲(chǔ)在RAM內(nèi)存中,而無(wú)需經(jīng)常從頭加載。這意味著分析結(jié)果的返回速度大大加快,足以勝任互動(dòng)分析工作。(見下圖)

spark-lr

在Spark的出生地——加州伯克利大學(xué)的AMP實(shí)驗(yàn)室,研究人員用Spark分析垃圾郵件過(guò)濾、自然語(yǔ)言處理以及交通路況預(yù)測(cè)等任務(wù)。Spark還被用來(lái)給Conviva、Klout和Quantifind等公司的數(shù)據(jù)分析服務(wù)提速。無(wú)疑,Spark處理分布式數(shù)據(jù)集的框架不僅是有效的,而且是高效的(通過(guò)簡(jiǎn)潔的Scala腳本)。Spark和Scala目前都還尚處于開發(fā)中。盡管如此,隨著加入更多的關(guān)鍵互聯(lián)網(wǎng)特性,它越來(lái)越從有趣的開源軟件過(guò)渡為基礎(chǔ)的web技術(shù)。

責(zé)任編輯:彭凡 來(lái)源: IT經(jīng)理世界
相關(guān)推薦

2013-05-14 10:01:57

Luchy Sort

2013-05-14 09:17:14

Twitter大數(shù)據(jù)Lucky Sort

2020-03-24 15:16:09

Salesforce大數(shù)據(jù)Einstein An

2017-11-06 14:48:01

大數(shù)據(jù)法醫(yī)犯罪

2017-10-19 08:28:15

大數(shù)據(jù)HadoopSpark

2012-12-06 10:59:51

大數(shù)據(jù)

2013-08-01 09:09:39

大數(shù)據(jù)

2013-04-19 14:28:07

大數(shù)據(jù)

2017-10-11 11:10:02

Spark Strea大數(shù)據(jù)流式處理

2023-06-05 05:39:35

大數(shù)據(jù)

2009-03-03 11:31:21

Twintter集成搜索

2014-05-27 16:23:46

Twitter開放數(shù)據(jù)

2018-04-17 09:03:01

SparkRDD大數(shù)據(jù)

2013-05-09 09:35:00

Cloudmeter大數(shù)據(jù)

2014-03-27 09:36:36

Spark

2022-04-02 09:32:06

大數(shù)據(jù)數(shù)據(jù)智能企業(yè)

2020-06-23 14:12:23

大數(shù)據(jù)IT技術(shù)

2020-12-24 15:00:50

物聯(lián)網(wǎng)大數(shù)據(jù)數(shù)據(jù)分析

2021-03-15 14:02:21

大數(shù)據(jù)數(shù)據(jù)開發(fā)Spark

2013-01-10 12:54:29

大數(shù)據(jù)探討Twitter
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 97免费在线视频 | 亚洲日韩中文字幕一区 | 99热这里| 亚洲国产精品一区二区第一页 | 久久久精| 一区二区三区四区免费在线观看 | 免费av电影网站 | 日本天天操 | 日韩激情视频一区 | 国产一区二区三区视频免费观看 | 999久久久国产精品 欧美成人h版在线观看 | 国产三区在线观看视频 | 日韩理论电影在线观看 | 亚洲精品乱码久久久久久久久 | 日本免费在线观看视频 | av在线免费观看网站 | 欧美1区2区 | 欧美一级黑人aaaaaaa做受 | 91丨国产| 国产日韩精品久久 | 中文字幕一区二区三区不卡 | 日韩午夜影院 | www.日日夜夜 | 一区二区在线不卡 | 欧美最猛黑人xxxⅹ 粉嫩一区二区三区四区公司1 | 亚洲综合色丁香婷婷六月图片 | 日韩视频国产 | 亚洲成人日韩 | 在线观看av网站 | 亚洲欧美日韩中文字幕一区二区三区 | 美女爽到呻吟久久久久 | 日韩在线中文 | 成人精品视频免费 | 精品国产久 | 国产精品美女久久久久久久久久久 | 99热精品在线观看 | 欧美三级三级三级爽爽爽 | 日本在线播放 | 日本a在线 | 一级片免费视频 | 国产精品日韩欧美一区二区三区 |