成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

巧用云平臺簡化Spark集群與大數據部署

譯文
數據庫 Spark
在本屆Spark 2014峰會上,Databricks公司CEO Ion Stoica在主題演講中公布了Databricks云——這是一套針對內存內集群計算的交鑰匙平臺,承諾以Hadoop MapReduce為基礎給大數據處理任務帶來顯著性能提升。

在日前于舊金山舉辦的Spark 2014峰會上,Databricks公司CEO Ion Stoica通過主題演講公布了Databricks云——這是一套以Apache Spark開源處理引擎為核心構建而成的云平臺,專門負責大數據處理工作。

Spark項目在一個月之前才剛剛完成了其v1.0版本,這是一套集群計算框架、設計目的在于以Hadoop分布式文件系統(tǒng)(簡稱HDFS)為基礎取代原本的Hadoop MapReduce。借助對內存內集群計算的支持能力,Spark得以在內存機制的輔助下將Hadoop MapReduce的性能表現(xiàn)提升達100倍,而磁盤配合時的性能提升也能達到原先的10倍。

Spark在工作流程、高級分析、流處理以及商務智能/可視化分析等數據處理領域可謂一款出色的計算引擎。不過Spark集群則是一套殊難打理的性能巨獸,Stoica強調稱。Databricks公司希望改變這一切,利用由其托管的Databricks云平臺為客戶提供易于使用的交鑰匙解決方案。

“對于企業(yè)用戶來說,將自身在大數據領域所投入的資金充分轉化為實際價值仍然是一項非常困難的任務,”Stoica表示。“這類集群很難設置與管理,而且要從數據中提取出可資利用的實際價值需要配合各種不同類型的工具方案,這無疑使整項工作難上加難。我們Databricks的愿望是能夠顯著簡化大數據處理方式,幫助用戶將精力集中在數據向實際價值的轉化身上。Databricks云能夠將Spark的強大能力與零管理托管平臺結合起來,并提供常見工作流程所必需的初始應用程序集合,這一切將有助于我們把發(fā)展愿景變成現(xiàn)實。”

Databricks云還能夠為交互式查詢(通過Spark SQL)、流數據(Spark Streaming)、機器學習(MLlib)以及圖形計算(GraphX)以原生方式提供支持,同時利用單一API跨越全部數據傳輸通道。Stoica表示,這套經過配置的全新Spark集群可謂一大轉折點,用戶只需為集群設定好必要的資源容量、其它工作該平臺都能獨力完成——包括在運行過程中對服務器進行配置、簡化數據導入與緩存機制、在安全性角度對Spark進行補丁安裝與更新。

該平臺還包含三款內置應用程序:

Notebooks。這是一套富界面,用于執(zhí)行數據發(fā)現(xiàn)與瀏覽任務。Notebooks能夠以交互式方式繪制查詢結果、以腳本方式執(zhí)行整套工作流并實現(xiàn)高級協(xié)作功能。

Dashboards。Dashboards允許用戶從之前創(chuàng)建的Notebooks當中選擇任意輸出結果,進而將其創(chuàng)建成儀表板形式并加以管理。Dashboards隨后會將結果輸出到單一頁面中的儀表板內,同時提供WYSIWYG編輯器、從而將內容向更為廣泛的受眾加以提交。

Job Launcher。Job Launcher應用程序允許任何使用者運行任意Apache Spark作業(yè)并在執(zhí)行過程中予以觸發(fā),這能大大簡化創(chuàng)建數據產品的實際流程。

“我們了解到,大多數企業(yè)用戶都在抱怨大數據處理并不是單一一項分析工作;真正的執(zhí)行流程需要將數據存儲、ETL(即提取、轉換與加載)、數據瀏覽、儀表板與報告、高級分析以及數據產品創(chuàng)建等步驟結合起來,”Stoica指出。“利用當前的技術成果完成上述工作可以說相當困難。我們打造的Databricks云正是為此而生,它能夠在設備之上建立起終端到終端通道,同時支持全部強化性以及功能補充性Spark應用程序。它的設計目的在于將原本被大數據處理的超高復雜性嚇退的新用戶們重新回到這塊***價值的分析舞臺上來。”Stoica指出,上述內置應用程序還僅僅是個起點。Databricks云以100%純開源Apache Spark項目為基礎開發(fā)而成,這意味著全部現(xiàn)有以及未來將要出現(xiàn)的“經過Spark認證”的應用程序都將能夠運行在這套開箱即用的平臺之上——其中也包括十幾款Databricks于今年二月啟動其應用認證計劃以來獲得肯定的Spark應用程序。

此外,Stoica還談到,大家完全可以反其道行之。任何在Databricks云上開發(fā)而成的Spark應用程序也將能夠運行在全部“經過認證的Spark發(fā)行版”當中,也就是說用戶不會被鎖定在某種特定托管平臺身上。Databricks于上周正式啟動了其發(fā)行版認證計劃,并強調稱目前已經有五家供應商通過了認證過程,它們分別是:Datastax、Hortonworks、IBM、甲骨文以及Pivotal。

“我們衷心期待著能夠將Databricks云打造成一整套豐富多彩的生態(tài)系統(tǒng),”Stoica表示。

Databricks云目前正與幾家用戶配合進行封閉beta測試,并計劃于今年八月開放限定可用beta測試,Stoica解釋稱。他同時補充道,該平臺將采用分層定價模型作為基礎計費機制,根據使用量核算使用成本。初期該平臺將只在Amazon Web Services(簡稱AWS)上與用戶見面,不過Stoica強調未來有計劃將其擴展到其它云供應商的基礎設施當中。

原文鏈接:

http://www.cio.com/article/2369158/big-data/cloud-platform-simplifies-spark-clusters-big-data-deployments.html

原文標題:Cloud Platform Simplifies Spark Clusters, Big Data Deployments

責任編輯:彭凡 來源: 51CTO
相關推薦

2017-01-11 16:57:51

大數據大數據集群監(jiān)控

2012-07-27 09:37:07

大數據云計算

2014-04-16 10:41:58

Spark

2020-05-29 16:14:03

戴爾科技

2016-12-21 09:57:03

大數據

2016-09-19 10:01:01

2014-05-16 10:55:47

Spark

2014-03-12 14:57:04

2014-12-05 15:37:06

2015-02-03 03:18:56

SparkSpark內核

2014-06-25 13:57:50

云計算大數據Spark

2017-01-22 10:40:31

Hadoop云部署大數據

2009-08-03 10:02:15

BMCBSMITIL

2013-11-19 10:42:45

大數據Chef

2017-06-14 09:00:40

容器開發(fā)人員云應用

2023-08-25 15:13:16

大數據云計算

2023-11-02 09:00:00

Kubernetes集群

2017-02-13 20:05:19

智慧城市大數據云平臺

2016-06-16 09:56:17

Cloudera

2017-01-06 16:06:53

存儲IBM軟件
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕高清在线 | 中文天堂在线观看 | 男女污污网站 | 热久久性 | 日本免费一区二区三区四区 | 欧美电影在线观看网站 | 精品免费在线 | 久久亚 | 国产精品久久久久久久7电影 | a在线视频| 国产三区视频在线观看 | 国产在线播 | 日本淫视频 | 激情欧美一区二区三区中文字幕 | 久草欧美视频 | 国产1区| 91亚洲免费 | 伊人二区 | 麻豆av在线免费观看 | 久久久精品一区 | 久久性色 | 精品一区二区三区四区 | 国产综合网站 | 夜夜爽99久久国产综合精品女不卡 | 国产精品久久久久久52avav | 日韩欧美在线视频 | 日本视频一区二区三区 | 欧美aaaaaaaa| 欧美xxxx色视频在线观看免费 | 久久精品二区亚洲w码 | 成人精品系列 | 久久久久久免费观看 | 久久国产精品久久久久久久久久 | 久久久www成人免费无遮挡大片 | av喷水| 一区在线视频 | 国产精品自在线 | 成人1区2区 | 日韩精品影院 | 亚洲图片一区二区三区 | 中文字幕国产在线 |