成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Twitter程序員推動(dòng)Hadoop開發(fā)進(jìn)程

云計(jì)算 Hadoop
由于Twitter的數(shù)百萬(wàn)用戶能夠彼此間實(shí)時(shí)分享最新新聞、想法、意見,Twitter成為了目前最受歡迎的通信平臺(tái)。所有這些活動(dòng)都為Twitter帶來(lái)了海量的元數(shù)據(jù),而這些元數(shù)據(jù)對(duì)于Twitter來(lái)說(shuō)是一筆寶貴財(cái)富。

為了分析海量元數(shù)據(jù)和信息,除了部署Cascading架構(gòu)以簡(jiǎn)化MapReduce部署外,Twitter還選擇了Hadoop。

由于Twitter的數(shù)百萬(wàn)用戶能夠彼此間實(shí)時(shí)分享***新聞、想法、意見,Twitter成為了目前***的通信平臺(tái)。所有這些活動(dòng)都為Twitter帶來(lái)了海量的元數(shù)據(jù),而這些元數(shù)據(jù)對(duì)于Twitter來(lái)說(shuō)是一筆寶貴財(cái)富。為了分析這些包含了1.75億多條日常推文和廣告活動(dòng)的拍字節(jié)級(jí)數(shù)據(jù),Twitter的分析團(tuán)隊(duì)選擇了一個(gè)大型的Hadoop商店。這些分析工作的目標(biāo)是,提升企業(yè)為終端用戶和廣告商所提供服務(wù)的品質(zhì)。

開發(fā)人員利用Hadoop將MapReduce工作定義為允許一個(gè)詳細(xì)規(guī)定的任務(wù),尤其是分析任務(wù),能夠在跨服務(wù)器環(huán)境下對(duì)大量數(shù)據(jù)進(jìn)行分析。對(duì)于Twitter而言,他們所面臨的一個(gè)重大挑戰(zhàn)是,MapReduce編程需要一些除Java之外的特殊技能。開發(fā)人員要重新考慮他們的編碼方式,而這正是Hadoop的優(yōu)勢(shì)所在。此外,Twitter的團(tuán)隊(duì)需要能夠執(zhí)行更為復(fù)雜的計(jì)算、機(jī)器學(xué)習(xí)和線性代數(shù)。對(duì)于普通的開發(fā)者來(lái)說(shuō),不經(jīng)過(guò)必要的培訓(xùn)根本無(wú)法在MapReduce上進(jìn)行編程。

駕馭Hadoop

對(duì)于任何開發(fā)人員來(lái)說(shuō),他們都希望復(fù)雜的統(tǒng)計(jì)功能能夠變得更為易用,為此Twitter選擇了Current的Cascading架構(gòu),因?yàn)樵摷軜?gòu)專門考慮到了創(chuàng)建大數(shù)據(jù)應(yīng)用這一問(wèn)題。

Cascading提供了一個(gè)針對(duì)Hadoop的更高級(jí)的抽象層,允許開發(fā)人員用不同的語(yǔ)言迅捷地創(chuàng)建可在Ruby、Scala等JVM上運(yùn)行的復(fù)雜任務(wù)。這實(shí)際上打破了技術(shù)壁壘,因此讓Twitter的開發(fā)人員能夠更為廣泛地使用Hadoop。

目前,Cascading已經(jīng)能夠讓Twitter的開發(fā)人員用他們自己喜歡的編程語(yǔ)言創(chuàng)建復(fù)雜的數(shù)據(jù)處理工作流,并且能夠很方便地升級(jí)以處理數(shù)以拍計(jì)的數(shù)據(jù)。Twitter已經(jīng)與Concurrent簽署了一份捐贈(zèng)協(xié)議。這樣一來(lái),Twitter的開源貢獻(xiàn)內(nèi)容可以很方便地應(yīng)用在Cascading的項(xiàng)目中。

深度使用

目前Twitter的三個(gè)團(tuán)隊(duì)正在結(jié)合編程語(yǔ)言使用Cascading。具體的分工是,營(yíng)收?qǐng)F(tuán)隊(duì)使用的是Scala,發(fā)布者分析團(tuán)隊(duì)使用的是Clojure,分析團(tuán)隊(duì)使用的是Jython。營(yíng)收?qǐng)F(tuán)隊(duì)可以通過(guò)分析廣告內(nèi)容和Twitter話題等因素幫助廣告商決定哪些廣告收效***,以幫助增加客戶轉(zhuǎn)化率。他們編寫了針對(duì)Cascading的開源Scala應(yīng)用程序接口Scalding,因此開發(fā)人員能夠在Scala上編程并在Hadoop上運(yùn)行它們。

發(fā)布者分析團(tuán)隊(duì)可以幫助網(wǎng)站管理員搞清楚Twitter用戶是如何處理涉及品牌、網(wǎng)站和網(wǎng)絡(luò)公眾人物的信息。他們創(chuàng)建并公布了以Clojure為基礎(chǔ)的語(yǔ)言——Cascalog的源代碼。Cascalog能夠?qū)ascading作為任務(wù)執(zhí)行引擎。

分析團(tuán)隊(duì)的任務(wù)則是理解Twitter用戶的活動(dòng)。他們需要一種方法,以便更容易地對(duì)跟在其他用戶之后的用戶、或是跟在同類用戶之后的用戶進(jìn)行精密而復(fù)雜地分析。他們?yōu)榇藙?chuàng)建了PyCascading,以控制來(lái)自Python的所有數(shù)據(jù)處理工作流。

在這些案例中,Cascading能夠讓開發(fā)人員避開編寫、優(yōu)化和執(zhí)行MapReduce任務(wù)的煩擾。同時(shí),它們還允許每個(gè)團(tuán)隊(duì)高效而迅捷地傳輸他們所需的復(fù)雜信息與功能。這些結(jié)果能夠提供重要的洞察力,幫助Twitter持續(xù)提升自己的服務(wù)品質(zhì)。

責(zé)任編輯:王程程 來(lái)源: InfoWorld
相關(guān)推薦

2013-05-31 09:05:47

2018-03-20 09:58:54

程序員質(zhì)量開發(fā)

2012-06-11 09:43:34

云計(jì)算

2019-01-02 07:36:28

微軟 Windows 程序員

2009-04-30 09:02:53

AcerAndroid開發(fā)

2019-11-27 10:08:36

程序員技能開發(fā)者

2013-08-20 09:33:59

程序員

2012-03-06 09:22:46

程序員

2018-01-19 22:43:13

2013-11-13 15:22:16

架構(gòu)系統(tǒng)架構(gòu)

2009-05-21 15:58:12

程序員工作經(jīng)驗(yàn)職場(chǎng)

2011-05-13 14:34:02

程序員

2011-05-10 09:29:30

代碼重寫

2020-07-16 10:19:43

程序員技能開發(fā)者

2014-03-28 10:30:20

程序員碼農(nóng)

2015-04-10 19:37:34

程序員

2022-03-16 11:10:19

程序員社區(qū)技術(shù)

2013-07-12 10:58:16

程序員

2012-11-22 14:00:26

程序員

2017-11-14 21:30:15

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 伊人超碰 | 欧洲一区二区三区 | 日本 欧美 国产 | 日韩视频免费看 | 一区二区三区四区国产 | 午夜国产一级 | 亚洲在线一区 | 亚洲视频免费在线观看 | 国产精品免费大片 | 在线伊人网 | 欧美午夜精品久久久久久浪潮 | 中文字幕第二区 | 久久99一区二区 | 亚洲一区二区三区在线 | 日日日干干干 | 日韩高清一区 | 日韩一区精品 | 精品国产免费人成在线观看 | 人人人人干 | 一级国产精品一级国产精品片 | 日韩一区三区 | 国产一区中文字幕 | 亚洲欧美一区二区三区1000 | 亚洲网站在线 | 日韩激情免费 | 国产精品毛片一区二区在线看 | 国产清纯白嫩初高生视频在线观看 | 成人黄色在线 | 午夜视频一区二区 | www.日韩系列 | 嫩呦国产一区二区三区av | 伊色综合久久之综合久久 | www.成人.com | 欧洲亚洲精品久久久久 | 国产一二区免费视频 | 日韩一区二区三区精品 | 亚洲精品日韩一区二区电影 | 天天操妹子 | 久久中文字幕视频 | 久久久久久久久99精品 | 国产精彩视频 |