成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

董西成:數據基礎設施、數據收集、存儲與計算系統

原創
數據庫
本屆WOT軟件技術峰會特邀小象科技作為大會特邀合作伙伴,匯集大數據社區技術精英,于7月27日舉辦大數據專場培訓。本次培訓主要討論如何建立用戶標簽系統和如何使用這些標簽系統實現商業價值。

無論是電商還是互聯網廣告,直接面對的是用戶,用戶的屬性決定了他會購買哪些商品或者點擊哪些廣告。那么建立用戶標簽系統對于這些企業非常重要。

本屆WOT軟件技術峰會特邀小象科技作為大會特邀合作伙伴,匯集大數據社區技術精英,于7月27日舉辦大數據專場培訓。本次培訓主要討論如何建立用戶標簽系統和如何使用這些標簽系統實現商業價值。

[[116385]]

講師:董西成

ChinaHadoop小象社區核心成員

《Hadoop技術內幕:深入解析MapReduce架構設計與實現原理》和《Hadoop技術內幕:深入解析YARN架構設計與實現原理》書籍作者;資深Hadoop技術實踐者和研究者,曾參與商用Hadoop原型研發,以及分布式日志系統、全網圖片搜索引擎、Hadoop調度器等項目的設計與研發。

1. 從技術來說,您認為大數據在今年還會有什么革新?總體感覺,如何與行業應用結合?

從技術方面,個人認為計算框架方面將有飛速發展,包括內存計算、流式計算和交互式計算等,這主要涉及Spark/Spark SQL和Hive On Tez技術體系,尤其是spark,引起來各大公司興趣,均嘗試使用spark解決之前MapReduce不能夠很好解決的問題??傮w而言,Spark等系統能夠很好地解決對效率要求較高的問題,典型地是迭代式的機器學習算法,這也是公司嘗試Spark的最初動力。

2. 行業大數據其實早就存在,但對此認知并不一樣,您認為這種差異性表現在哪里?

大數據存儲和分析方面的技術能力存在差異。之前缺乏廉價可用的分布式技術存儲和分析大數據,使得很多公司丟棄了很多數據,或者僅僅是將一部分數據保存下來,未進行分析。如今大數據存儲和處理計算日漸成熟,尤其是開源技術的飛速發展和互聯網公司的帶動,使得行業大數據成為爆發點。

3. 行業大數據的實施,您認為技術難點在哪里?

個人認為難點在技術方案的轉變。目前很多傳統行業仍采用非常過時的技術方案,這些方案難以支撐大數據,鑒于此,很多公司嘗試朝大數據架構轉型,但由于過多的歷史包袱以及缺乏大數據技術的理解和信心,使得整個過程非常緩慢。

4. 請分享一個您參與的傳統企業大數據項目。這個項目大致分幾個階段?

介紹一個銀行的項目,該項目的目的是ATM等終端設備的日志收集和分析,這是銀行的一個試探性項目,可認為是對大數據開源技術的嘗試,由于這一塊跟已有架構重疊較小,因為不能很好地代表一般的大數據項目。這個項目經過了可行性分析,技術驗證(小規模數據測試),項目開發,項目上線和運營等幾個階段。

5. 大數據項目的實施,對已經存在的業務分析架構,會帶來怎樣的影響?

取決于跟已存在業務分析架構的相關關系,如果是互相補充和完善,則巧妙地設計會完善公司的業務分析架構,如果是替代,則會逐步將業務遷移到大數據架構上。

6. 大數據應用工具的大量出現,會取代數據分析人員的位置嗎?

短時間內,數據分析人員仍處于不可或缺的位置。大數據應用工具扔僅僅是數據分析人員完成數據分析的工具,難以將全部分析交給這些工具完成而無需分析人員的干預。

7. 數據是傳統企業最核心的資產。我們在大數據的分布式處理方式下,該如何保證數據的安全性和完整性?

數據安全性和完整性是大數據時代面臨的***挑戰之一,目前國內很大一部分公司扔將大數據保存在自己私有的集群中,不會直接接入互聯網,這樣,可以把安全問題局限在一個局域網內,解決起來容易一些。

8. 在51CTO舉辦的WOT軟件技術峰會上,會有大數據專場培訓。這里面會涉及哪些方面的內容?這些培訓適合哪些技術人員?

這次專場培訓,我主要介紹數據基礎設施,包括數據收集、存儲與計算系統,具體是

(1)數據收集: 使用分布式收集工具Sqoop/Flume對數據進行統一收集

(2)數據存儲:使用分布式存儲系統HDFS/HBase對數據進行集中式存儲

(3)數據分析與計算:包括批處理、交互式和內存計算三種

這次培訓適合想了解大數據技術的初中級技術人員以及想了解大數據應用案例的高級技術人員。

責任編輯:彭凡 來源: 51CTO
相關推薦

2017-12-04 08:48:50

數據存儲基礎

2023-05-12 15:15:23

數字化轉型大數據

2013-05-15 15:26:19

數據中心綜合布線布線實施

2024-09-30 11:29:07

2021-11-25 17:00:26

數據

2015-12-07 09:39:53

光纖數據中心

2017-06-09 15:25:23

IT設施數據中心融合

2012-09-04 10:35:49

數據中心布線系統

2013-08-22 09:55:19

數據中心云計算基礎設施

2021-09-10 13:23:57

數據閃存 磁盤

2013-07-16 09:42:32

數據中心布線技巧

2020-06-04 17:12:08

華為OceanStor存儲

2019-12-25 11:05:07

云計算混合云技術

2018-12-17 13:00:19

2010-03-26 10:41:14

云計算

2012-08-21 10:26:15

云計算數據中心

2020-02-24 11:08:27

云計算網絡攻擊數據

2022-08-09 11:51:49

數據存儲智慧城市

2022-05-17 15:51:32

數據中心運維能力基礎設施
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久久久免费毛片精品 | 国产剧情一区 | 黄色网址免费在线观看 | 亚洲色图综合 | 亚洲成人国产 | 欧美国产日韩在线 | 国产色爽 | 国产特级毛片aaaaaa喷潮 | 在线观看视频一区二区三区 | 日韩免费av网站 | 国产精品亚洲视频 | 日本在线中文 | 国产欧美精品一区二区三区 | 免费观看一级毛片 | 国产精品精品 | 91在线最新| 粉嫩一区二区三区性色av | 天堂资源视频 | 91精品国产综合久久久久久丝袜 | 91欧美激情一区二区三区成人 | 99热在线免费 | 国产精品免费在线 | 成人在线视频免费观看 | 国产1页| 国产精品成人av | 一区二区三区国产 | 日韩一区二区三区精品 | 色综合视频 | h视频免费在线观看 | 伊人狠狠| 我想看一级黄色毛片 | www.99精品 | 欧美区在线 | 人人干视频在线 | 91在线一区二区三区 | 精品国产区 | 亚洲另类视频 | 久久激情视频 | 国产在线a| av先锋资源| 欧美日韩一区二区三区不卡视频 |