成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

將Spark部署到Hadoop 2.2.0上

開發 前端 Hadoop Spark
本文介紹的是如何將Apache Spark部署到Hadoop 2.2.0上,如果你們的Hadoop是其他版本,比如CDH4,可直接參考官方說明操作。

本文介紹的是如何將Apache Spark部署到Hadoop 2.2.0上,如果你們的Hadoop是其他版本,比如CDH4,可直接參考官方說明操作。

需要注意兩點:(1)使用的Hadoop必須是2.0系列,比如0.23.x,2.0.x,2.x.x或CDH4、CDH5等,將Spark運行在 Hadoop上,本質上是將Spark運行在Hadoop YARN上,因為Spark自身只提供了作業管理功能,資源調度要依托于第三方系統,比如YARN或Mesos等 (2)之所以不采用Mesos而是YARN,是因為YARN擁有強大的社區支持,且逐步已經成為資源管理系統中的標準。

注意,目前官方已經發布了0.8.1版本,可以直接從這里選擇合適的版本下載,如果你使用的是hadoop 2.2.0或者CDH5,可以直接從這里下載。

將Spark部署到Hadoop 2.2.0上需要經過以下幾步:

步驟1:準備基礎軟件

步驟2:下載編譯spark 0.8.1或者更高版本

步驟3:運行Spark實例

接下來詳細介紹這幾個步驟。

步驟1:準備基礎軟件

(1) 基本軟件

包括linux操作系統、Hadoop 2.2.0或者更高版本、Maven 3.0.4版本(或者最新3.0.x版本),其中,Hadoop 2.2.0只需采用最簡單的方式安裝即可,具體可參考我的這篇文章:Hadoop YARN安裝部署,Maven安裝方法很簡單,可以在http://maven.apache.org/download.cgi上下載binary版本,解壓后,配置MAVEN_HOME和PATH兩個環境變量,具體可自行在網上查找相關方法,比如這篇“Linux下安裝maven”,但需要注意,版本不是3.0.x版,Spark對版本要求很嚴格。

(2)硬件準備

Spark 2.2.0專門搞出來一個yarn-new支持hadoop 2.2.0,因為hadoop 2.2.0的API發生了不兼容變化,需要使用Maven單獨編譯并打包,而編譯過程非常慢(一般機器,2個小時左右),且占用內存較多,因此,你需要一 臺滿足以下條件的機器作為編譯機:

條件1:可以聯網:第一次編譯時,maven需要從網上下載大量的jar包,速度比較慢,如果你網絡不行,建議直接放棄編譯。

條件2:內存2GB以上

步驟2:下載編譯spark 0.8.1或者更高版本

可以用git下載或者直接wget或者spark 0.8.1版本

wget https://github.com/apache/incubator-spark/archive/v0.8.1-incubating.zip

注意,0.8.1之前的版本不支持hadoop 2.2.0,從0.8.1版本開始支持。

下載之后,對其解壓:

  unzip v0.8.1-incubating

然后進入解壓目錄,輸入以下命令:

 

cd incubator-spark-0.8.1-incubating

export MAVEN_OPTS=”-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m”

mvn -Dyarn.version=2.2.0 -Dhadoop.version=2.2.0  -Pnew-yarn -DskipTests package

 

一般需要等待很長時間,編譯完成后,將spark內核打包成一個獨立的jar包,命令如下:

原文鏈接:http://dongxicheng.org/framework-on-yarn/build-spark-on-hadoop-2-yarn/

責任編輯:陳四芳 來源: dongxicheng.org
相關推薦

2014-01-07 10:36:32

EclipsSpark

2014-04-09 10:55:55

Cloudera\Sp

2013-07-26 16:38:54

OpenStackHadoop

2011-01-13 14:19:41

solarisLinux

2011-12-28 14:32:17

eclipsetomcat

2013-03-07 10:56:03

英特爾HadoopXeon

2019-11-26 08:00:00

GitHubGitHub ActiAzure

2017-04-19 11:17:48

SparkHadoopMapReduce

2013-02-28 10:32:07

hadoop英特爾apache

2013-02-21 09:41:49

CitusData數據庫Postgres

2014-04-16 10:41:58

Spark

2011-10-17 10:25:09

SiriiPhone4

2017-12-17 16:49:44

Apache HadoYarnHadoop

2012-05-18 11:12:09

TitaniumMetro UIiOS

2025-02-17 08:00:00

機器學習開發Docker

2020-11-10 08:00:00

機器學習技術科學

2013-12-04 13:32:30

2010-11-19 15:17:01

oracle數據備份

2017-11-13 13:39:24

SparkHadoop大數據

2020-05-27 11:20:37

HadoopSpark大數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品一 | 毛片站| 国产草草视频 | 狠狠干综合视频 | 欧美激情一区二区 | 亚洲交性 | 日韩在线中文 | 不卡一区二区三区四区 | 色综合久久久久 | 日韩在线中文字幕 | 黄色a三级 | 成人精品一区亚洲午夜久久久 | 久久99精品久久久久久秒播九色 | av中文字幕在线 | 亚洲一区 | 亚洲人成一区二区三区性色 | 国产色婷婷精品综合在线播放 | 成人免费黄视频 | 欧美黄色免费网站 | 亚洲国产精品91 | 国产国产精品久久久久 | 日韩有码在线观看 | 日韩精品一区二区在线观看 | 精品国产不卡一区二区三区 | 狠狠综合久久av一区二区小说 | 黄视频网站免费观看 | 国产成人精品免高潮在线观看 | 国产无套一区二区三区久久 | 亚洲欧洲国产视频 | 九一在线 | 欧美日本在线 | 91精品午夜窝窝看片 | 免费h在线 | 一级片在线观看 | 国产精品一二三区 | 欧美片网站免费 | 成人国产精品免费观看 | 中文字幕在线观看一区二区 | 精品欧美一区二区三区久久久小说 | 亚洲一区二区三区 | www.狠狠操 |