成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

為什么你的大數(shù)據(jù)項目瞬間就”涼”了?

大數(shù)據(jù)
企業(yè)正努力在產(chǎn)品中部署大數(shù)據(jù),這一點是毋庸置疑的。但是,根據(jù)Gartner在2016年下半年發(fā)布的新聞稿:只有15%的企業(yè)將其大數(shù)據(jù)項目部署到生產(chǎn)中。“Gartner在選詞時非常謹慎,這并不意味著剩下的企業(yè)沒有實踐,或者數(shù)據(jù)科學家沒有發(fā)現(xiàn)使用大數(shù)據(jù)技術的優(yōu)勢,只是剩下的85%的項目并沒有真正投入生產(chǎn)。

企業(yè)正努力在產(chǎn)品中部署大數(shù)據(jù),這一點是毋庸置疑的。但是,根據(jù)Gartner在2016年下半年發(fā)布的新聞稿:只有15%的企業(yè)將其大數(shù)據(jù)項目部署到生產(chǎn)中。“Gartner在選詞時非常謹慎,這并不意味著剩下的企業(yè)沒有實踐,或者數(shù)據(jù)科學家沒有發(fā)現(xiàn)使用大數(shù)據(jù)技術的優(yōu)勢,只是剩下的85%的項目并沒有真正投入生產(chǎn)。 

[[224619]]

問題不在于缺少大數(shù)據(jù)分析或者是大量的數(shù)據(jù)科學實驗。真正的挑戰(zhàn)是缺乏大數(shù)據(jù)自動化能力,以便將實驗版本從沙箱推入功能齊全的生產(chǎn)環(huán)境中。

大多數(shù)人認為分析生產(chǎn)就是調(diào)整集群。當然,可以編寫一個sqoop腳本并將表格放入一次。但是,在不影響源系統(tǒng)的情況下多次實現(xiàn)則是一個挑戰(zhàn)。然后,必須確保構建的數(shù)據(jù)管道在由服務級別協(xié)議(SLA)設置的時間范圍內(nèi)提供數(shù)據(jù)。此外,數(shù)據(jù)模型需要針對用戶當前正在使用的工具(如Tableau,Qlik等)進行優(yōu)化,以達到用戶所期望的響應能力。

在Hadoop和Spark之上使用工具進行大量的努力和改進以對大型數(shù)據(jù)集進行快速原型設計。但原型是一回事,創(chuàng)建每天運行而不發(fā)生故障的數(shù)據(jù)工作流程,或者在數(shù)據(jù)流作業(yè)失敗時自動啟用恢復,又是另外一回事。

本文作者分析了五大大數(shù)據(jù)項目夭折最常見的技術原因:

1、無法快速加載數(shù)據(jù)以滿足SLA

雖然像sqoop這樣的工具支持數(shù)據(jù)讀取的并行化以從傳統(tǒng)數(shù)據(jù)源獲取數(shù)據(jù)到數(shù)據(jù)湖,但需要專家來使其正常工作。如何劃分數(shù)據(jù)?要運行多少個容器等問題都需要專家給出合適的解決方案。如果無法正確處理并行數(shù)據(jù)的讀取,則一個小時就可完成的任務甚至需要10到20倍的時間,因為大多數(shù)人不知道如何正確調(diào)整。

2、不能逐步加載數(shù)據(jù)以滿足SLA

大多數(shù)企業(yè)并未將整個操作轉(zhuǎn)移到大數(shù)據(jù)環(huán)境中。他們從現(xiàn)有的操作系統(tǒng)移動數(shù)據(jù)以執(zhí)行新的分析或機器學習,這意味著需要在新數(shù)據(jù)到達時繼續(xù)加載。問題是這些環(huán)境不支持添加,刪除或插入的概念,這意味著必須重新加載整個數(shù)據(jù)集(請參閱上面的第1點),否則必須圍繞一次更改捕獲問題編寫代碼。

3、不能以交互方式提供對數(shù)據(jù)報告的訪問權限

想象一下,如果有1000位商業(yè)智能分析師,他們都不想使用您的數(shù)據(jù)模型,因為他們需要很長時間才能查詢。這是Hadoop的一個經(jīng)典問題,也是許多公司僅使用Hadoop進行預處理和應用特定機器學習算法,但隨后將最終數(shù)據(jù)集移回傳統(tǒng)數(shù)據(jù)倉庫以供BI工具使用的原因。無論如何,這個過程又為成功完成大數(shù)據(jù)項目增加了難度。

4、不能從測試遷移到生產(chǎn)

許多企業(yè)能夠確定沙箱環(huán)境中數(shù)據(jù)科學家的新見解的潛力。一旦他們確定采納新的分析方法,就需要從沙盒轉(zhuǎn)移到生產(chǎn)環(huán)境。從開發(fā)轉(zhuǎn)移到生產(chǎn)是一個完整的升降和換擋操作,通常是手動完成的。雖然它在開發(fā)集群上運行良好,但現(xiàn)在相同的數(shù)據(jù)管道必須在生產(chǎn)集群上重新優(yōu)化。這種調(diào)整往往需要大量的返工才能有效執(zhí)行。如果開發(fā)環(huán)境與生產(chǎn)環(huán)境有任何不同,則情況尤其復雜。

5、不能管理端到端的生產(chǎn)工作量

大多數(shù)企業(yè)都將注意力集中在工具上,因此他們的數(shù)據(jù)分析師和科學家可以更輕松地識別新的方法。但是,他們沒有投資類似的工具來運行生產(chǎn)環(huán)境中的數(shù)據(jù)工作流程,因此不得不擔心啟動、暫停和重新啟動過程,還必須擔心確保作業(yè)的容錯性,處理通知以及協(xié)調(diào)多個工作流以避免“沖突”。

因為上述五大技術原因,導致很多大數(shù)據(jù)項目并沒有如期與我們見面。

責任編輯:未麗燕 來源: IT168
相關推薦

2018-04-11 09:50:04

大數(shù)據(jù)

2023-05-10 16:04:38

大數(shù)據(jù)架構

2019-05-23 09:50:46

大數(shù)據(jù)IT人工智能

2013-07-26 10:24:32

大數(shù)據(jù)項目大數(shù)據(jù)IT

2017-03-14 15:43:39

大數(shù)據(jù)項目Hadoop

2020-03-24 17:49:27

大數(shù)據(jù)IT技術

2018-04-15 21:39:04

大數(shù)據(jù)項目應用

2016-05-18 11:47:35

Apache大數(shù)據(jù)項目開源

2014-08-15 09:09:32

大數(shù)據(jù)

2022-06-30 21:08:25

大數(shù)據(jù)數(shù)據(jù)湖數(shù)據(jù)倉庫

2016-08-05 09:51:25

GPU大數(shù)據(jù)

2013-04-22 10:00:53

云計算大數(shù)據(jù)

2023-10-13 13:11:26

大數(shù)據(jù)技術開源

2016-03-21 18:56:54

物聯(lián)網(wǎng)IoTIT基礎架構

2014-12-10 10:51:54

OpenStackSahara云計算

2016-01-26 10:02:18

GitHub大數(shù)據(jù)開源

2016-12-13 19:40:00

大數(shù)據(jù)

2019-09-06 10:31:45

軟件開發(fā)地圖

2016-11-07 12:30:59

大數(shù)據(jù)互聯(lián)網(wǎng)

2013-09-24 10:53:39

Gartner大數(shù)據(jù)項目
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美在线观看一区 | 久草网址 | 日韩免费毛片视频 | 久久亚洲一区二区三区四区 | 在线播放第一页 | 久久久在线视频 | 国产精品精品 | 国产激情一区二区三区 | 曰韩三级 | 国产欧美一区二区精品久导航 | 久草在线| 国产亚洲一区二区三区 | 亚洲成人综合网站 | 欧美不卡 | 精品国产乱码久久久久久牛牛 | 亚洲免费视频在线观看 | 国产精品呻吟久久av凹凸 | 手机在线一区二区三区 | 亚洲综合99| 福利一区视频 | 国产美女自拍视频 | 中文字幕视频在线观看 | 综合中文字幕 | 亚洲精品亚洲人成人网 | 激情久久网 | 九九久久99| 国产伦精品一区二区三区精品视频 | 男女羞羞免费视频 | 国产在线色 | 福利视频一二区 | 欧美天堂在线观看 | 国产精品欧美一区二区三区不卡 | 国产一区二区三区在线看 | 一级午夜aaa免费看三区 | 精品日韩一区二区 | 国产精品视频500部 a久久 | 亚洲成人自拍 | 日韩国产在线 | 欧美手机在线 | 在线一区视频 | 日本精品一区二区三区在线观看视频 |