成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

構建成功大數據基礎設施的七大關鍵點

譯文
新聞 CIOAge
無論你關注軟件還是硬件,你為大數據構建的基礎設施都會對大數據系統將支持的分析和行動帶來巨大的影響。本文介紹了你在構建大數據架構時大有影響的7個因素。

【51CTO.com快譯】大數據是當今許多企業IT運營的一個重要組成部分。據知名調研公司IDC預測,到2019年,大數據市場產值將達到1870億美元。大數據是數據分析的一個關鍵部分,而分析又是機器和人類商業智能及決策的基礎。因為很明顯,要是沒有某種基礎設施,你無法獲得各種數據:大數據、小數據或完全正確的數據,所以有必要看一看有助于構建成功大數據架構的幾個因素。

其中,一些因素可能看起來很明顯,另一些則比較微妙。實際上,所有因素共同對你的大數據系統將支持的分析和行動帶來巨大的影響。

當然,不是說只有這七個因素才會對大數據基礎設施的工作方式帶來影響。大數據系統牽涉好多部分,但這七個因素值得你考慮,因為它們是許多其他部分和流程的基礎。

眼下,你可能在使用大數據,即便你是在一家小公司工作。這要拜現有的基礎設施部分所賜――其中許多部分連最小的IT部門也能訪問。

伴隨這種可訪問性而來的是,那些本身并不擁有數據科學專長的小公司員工可能感到困惑和沮喪。如果你處于這種情形,本文不會消除你的所有困惑,但是讓你可以開始向潛在的服務提供商和供應商提一些針對性的問題。

 

大數據遠不止Hadoop

在平常的談話中,大數據和Hadoop常常被人換著使用。這樣的結果讓人遺憾,因為大數據遠不止Hadoop。 Hadoop是一種文件系統(而不是數據庫),旨在跨數百或數千個處理節點傳送數據。它用于許多大數據應用,原因是作為一種文件系統,它擅長處理非結構化數據,這類數據甚至不像其周圍的數據。當然,一些大數據是結構化的,為此你需要一個數據庫。但數據庫是本文介紹的一個不同因素。

 

Hive和Impala將數據庫引入到Hadoop

這里說的是面向大數據世界中結構化數據的數據庫。如果你想讓Hadoop數據平臺井然有序,那么Hive可能正是你需要的。這種基礎設施工具讓你可以針對非常不像SQL的Hadoop處理類似SQL的操作。

如果你有一部分數據很容易放在結構化數據庫中,那么Impala是旨在駐留在Hadoop里面的數據庫,它還可以使用你從Hadoop轉換到SQL過程中開發的Hive命令。所有這三個(Hadoop、Hive和Impala)都是Apache項目,所以它們都是開源的。

 

Spark用于處理大數據

到目前為止,我們一直在談論存儲和組織數據。但是,如果你想實際處理數據又怎么樣?這時候,你就需要一種像Spark這樣的分析和處理引擎。Spark是另一個Apache項目,它包括一批開源和商業產品,拿來你添加到數據湖、倉庫和數據庫的數據后,對數據做一些有用的操作。

由于它可以訪問你能想象的任何數據的庫,Spark可用于處理存儲在各種地方的各種數據。它同樣是開源的,所以你可以隨意修改它。

 

你可以對大數據執行SQL操作

許多人知道如何構建SQL數據庫和編寫SQL查詢。面對大數據時,這種專長沒有必要浪費。Presto是一種開源SQL查詢引擎,它讓數據科學家可以使用SQL查詢,查詢駐留在從Hive到專有商業數據庫管理系統的任何環境的數據庫。它被Facebook之類的大公司用于交互式查詢,而交互式查詢這個短語是關鍵。Presto就好比是一種對龐大數據集執行即席交互式查詢的工具。

 

在線存儲有一席之地

一些大數據任務需要用到不斷變化的數據。有時候,這是定期添加的數據,有時是通過分析而更改的數據。不管在什么情況下,如果你的數據寫入與讀取一樣頻繁,那么你就需要該數據存儲在本地、聯機。如果你支付得起成本,還希望數據存儲在固態存儲介質上,因為這會大大加快速度――如果你在零售或交易場地的人員焦急地等待結果返回,這是個重要的考慮因素。

 

云存儲也有一席之地

如果在更龐大的聚合數據庫上進行分析,那么云是***的平臺。聚合數據并傳輸到云,運行分析,然后拆掉實例。這正是云最擅長的那種彈性需求響應。操作不會受到互聯網可能帶來的任何延遲問題的顯著影響。如果你把在專用本地系統上進行的實時分析與云端運行的深度分析結合起來,那么離充分發揮大數據基礎設施的潛力近在咫尺。

 

別忘了可視化

分析大數據是一回事,以一種對大多數人有意義的方式來顯示分析結果又是另一回事。圖形對于整個“解讀”工作大有幫助,所以應該將數據可視化視作是大數據基礎設施的一個關鍵部分。

幸好,有許多方法可以實現可視化,從JavaScript庫、商業可視化軟件包到在線服務,不一而足。最重要的是什么?從中選擇一小部分,試一試,并且讓你的用戶嘗試一下。你會發現,可靠的可視化是讓你的大數據分析盡可能出成果的***方式。

以上就是你在企業處理大數據時應知道并牢記的七個關鍵。

原文標題:7 Keys To Building A Successful Big Data Infrastructure;作者:Curtis Franklin Jr.

【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】

責任編輯:wangxuze 來源: 51CTO.com
相關推薦

2016-10-27 14:02:56

大數據數據庫

2010-12-30 14:52:33

云基礎設施

2018-07-05 14:42:52

大數據企業數據挖掘

2022-08-12 13:18:12

IT企業運營

2016-10-19 16:55:23

大數據

2016-11-03 09:55:10

大數據基礎設施

2015-03-05 09:18:03

2021-05-20 14:18:22

大數據數據分析工具

2010-03-29 17:08:04

Nginx squid

2014-05-15 11:33:26

數據中心大數據戰略

2013-07-02 09:46:11

大數據分析基礎設施架構

2024-09-04 08:31:01

語言模型設計

2012-12-04 18:11:46

LanSecS堡壘主機堡壘機

2017-08-09 08:09:27

IT基礎設施

2015-04-20 09:03:50

混合云混合云評估IT管理

2023-07-04 14:57:17

云計算公共云數據中心

2020-08-27 11:05:08

大數據互聯網數字

2021-09-24 15:46:16

數字化數字基礎設施

2021-09-30 10:36:14

AI

2024-03-29 14:25:44

云計算人工智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国内久久| 精品久久久一区二区 | 中文字幕在线观看一区 | 精品欧美一区二区精品久久久 | 午夜爽爽爽男女免费观看影院 | 色偷偷人人澡人人爽人人模 | 最近中文字幕在线视频1 | 中文字幕在线观 | 日韩久久综合网 | 国产农村妇女毛片精品久久麻豆 | av一区二区三区 | 精品一区二区观看 | 天天躁日日躁性色aⅴ电影 免费在线观看成年人视频 国产欧美精品 | www312aⅴ欧美在线看 | 天天插日日操 | 91影片| 国产国拍亚洲精品av | 国产成人精品一区二区三区视频 | 中文字幕第7页 | 一区观看 | 久久天天 | 国产欧美精品一区二区色综合朱莉 | 99久久国产| 天天操网 | 97精品久久 | 欧美中文字幕 | 亚洲日韩中文字幕 | 国产日产欧产精品精品推荐蛮挑 | 天天干视频在线 | 欧美一区二区三区四区视频 | 免费在线看黄 | 日韩久草| 国产一区高清 | 在线日韩中文字幕 | 中文字幕精品一区二区三区在线 | 欧美成人免费在线视频 | 日韩在线一区二区三区 | 国产一级在线 | 亚洲欧美日韩久久 | 国产精品久久久久久妇女6080 | 91免费高清视频 |