成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數(shù)據(jù)科學(xué)家大調(diào)查:職業(yè)受挫數(shù)據(jù)多樣性,吐槽Hadoop

大數(shù)據(jù) Hadoop
根據(jù)報告,有59%的數(shù)據(jù)科學(xué)家表示其所在企業(yè)已經(jīng)開始采用更加復(fù)雜的分析技術(shù),例如集群、機(jī)器學(xué)習(xí)、種量分析(Principal components analysis)、圖論分析等高級分析技術(shù)分析數(shù)據(jù),而不是局限于傳統(tǒng)的BI報告……

經(jīng)過無數(shù)權(quán)威媒體的反復(fù)轟炸,我們大致已經(jīng)相信,數(shù)據(jù)科學(xué)家是21世紀(jì)最神秘最性感最多金的職業(yè),他們是大數(shù)據(jù)時代數(shù)據(jù)炸彈的拆彈專家,企業(yè)數(shù)字化經(jīng)營的發(fā)動機(jī),他們的身價堪比NFL四分衛(wèi),而且,他們比昆侖山上的雪豹數(shù)量還少。

顯然,數(shù)據(jù)科學(xué)家個個都是十八般數(shù)據(jù)分析武藝樣樣精通的絕世高手,但他們近來也有煩心事。不久前,開源數(shù)據(jù)庫SciDB開發(fā)商Paradigm4進(jìn)行的一項(xiàng)針對111名北美數(shù)據(jù)科學(xué)家的調(diào)查顯示,71%的數(shù)據(jù)科學(xué)家認(rèn)為數(shù)據(jù)來源的多樣性(IT經(jīng)理網(wǎng)記者此前曾與百度創(chuàng)始七劍客之一,酷我音樂CEO雷鳴討論機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析的最大挑戰(zhàn),他也認(rèn)為是數(shù)據(jù)維度),而不是數(shù)據(jù)總量構(gòu)成其職業(yè)最大威脅和挑戰(zhàn)。

值得注意的是,只有48%的受訪數(shù)據(jù)科學(xué)家表示他們在工作中曾使用過Hadoop或者Spark,高達(dá)76%的數(shù)據(jù)科學(xué)家抱怨Hadoop太慢,編程速度過慢,以及其他一些局限性。(參考閱讀:Hadoop真特么難用

雖然Hadoop口碑不佳,但是有接近半數(shù)的數(shù)據(jù)科學(xué)家表示很難將數(shù)據(jù)存入傳統(tǒng)關(guān)系數(shù)據(jù)庫表中。Nexedi的首席執(zhí)行官Jean-Paul Smets在接受IT經(jīng)理網(wǎng)采訪時也曾指出,大數(shù)據(jù)的真正難題其實(shí)并不是所謂的“大”,業(yè)界目前缺乏是通過使用高效的分布式運(yùn)算法則來處理數(shù)據(jù)的軟件,Hadoop過于依賴Java,而Java已經(jīng)被Oracle牢牢控制。中國興起的去IOE運(yùn)動,實(shí)際上為Hadoop之外的大數(shù)據(jù)軟件方案提供了良機(jī)

企業(yè)大數(shù)據(jù)進(jìn)入復(fù)雜分析階段

根據(jù)報告,有59%的數(shù)據(jù)科學(xué)家表示其所在企業(yè)已經(jīng)開始采用更加復(fù)雜的分析技術(shù),例如集群、機(jī)器學(xué)習(xí)、種量分析(Principal components analysis)、圖論分析等高級分析技術(shù)分析數(shù)據(jù),而不是局限于傳統(tǒng)的BI報告。

還有15%的數(shù)據(jù)科學(xué)家表示計劃在明年啟用復(fù)雜分析技術(shù),另有16%的數(shù)據(jù)科學(xué)家表示將在未來兩年內(nèi)采用復(fù)雜分析技術(shù)。

Hadoop被過度吹捧

Paradigm4的報告指出,Hadoop被過度吹捧成無所不能的,革命性的大數(shù)據(jù)解決方案,實(shí)際上Hadoop并不適用于需要進(jìn)行復(fù)雜分析的大數(shù)據(jù)應(yīng)用場景。

Hadoop的核心技術(shù)方法數(shù)據(jù)并行(data parallel),被Paradigm4稱作“鬧心的并行”。報告指出,復(fù)雜分析人物往往需要經(jīng)常訪問、處理和分享全體數(shù)據(jù),并在數(shù)據(jù)處理中交叉溝通中間結(jié)果,而這恰恰是Hadoop MapReduce的軟肋。

22%的受調(diào)查數(shù)據(jù)科學(xué)家表示Hadoop和Spark壓根不適合他們的分析任務(wù),此外還有35%的數(shù)據(jù)科學(xué)家在嘗試Hadoop或Spark后停止使用這兩項(xiàng)技術(shù)。

Paradigm4數(shù)據(jù)科學(xué)家調(diào)查報告中的一些亮點(diǎn)被濃縮在下面這張信息圖中,供有興趣的讀者深究:

paradigm4-data-scientist-survey-infographic-100354377-large.idge

本文出自:IT經(jīng)理網(wǎng)

責(zé)任編輯:林師授 來源: IT經(jīng)理網(wǎng)
相關(guān)推薦

2014-07-08 09:14:54

Hadoop局限性

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2023-05-20 08:11:55

2011-12-02 10:07:26

國際寬帶

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2010-09-13 17:28:31

Linux調(diào)查

2016-12-06 08:47:18

數(shù)據(jù)算法

2010-06-01 16:48:23

SVN錯誤

2012-06-12 09:33:59

2018-10-16 14:37:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)據(jù)科學(xué)

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2012-10-09 13:41:09

數(shù)據(jù)科學(xué)家職業(yè)

2018-08-20 19:24:40

數(shù)據(jù)科學(xué)數(shù)據(jù)清理數(shù)據(jù)分析

2010-05-11 14:40:19

互聯(lián)網(wǎng)

2012-12-06 15:36:55

CIO

2015-08-25 13:20:29

數(shù)據(jù)科學(xué)

2020-04-09 15:32:20

數(shù)據(jù)科學(xué)AutoML代智能

2015-08-28 09:22:07

數(shù)據(jù)科學(xué)

2016-08-02 17:00:12

Hadoop大數(shù)據(jù)系統(tǒng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲国产精久久久久久久 | 亚洲在线视频 | 一级毛片免费视频观看 | 日韩精品国产精品 | 天天色天天色 | 在线不卡视频 | 三级视频在线观看 | 澳门永久av免费网站 | 久久久成 | 国产精品色 | 91在线 | 户外露出一区二区三区 | 国产精品亚洲一区 | 日韩精品免费在线观看 | 黄色一级免费看 | 成人黄色电影在线播放 | 在线免费观看黄视频 | 欧美中文一区 | 久久日韩粉嫩一区二区三区 | 亚洲免费视频在线观看 | 久久99精品久久久久久狂牛 | 99精品视频免费观看 | 成人午夜高清 | 一区二区三区中文字幕 | 午夜视频在线播放 | 久久精品国产99国产精品 | 中文字幕 国产 | 日韩一区二区三区在线 | 欧美久久久久久久 | 国产乱码精品一区二区三区忘忧草 | 一区二区免费在线视频 | 成人网视频 | 午夜视频一区二区 | 91亚洲欧美 | 一区二区视频在线 | 日韩中文字幕 | www.日韩 | 在线一级片| 国产一区二区小视频 | 国产精品资源在线观看 | 一区二区视频在线 |