Cloudera實現Hadoop過程中Hadoop設置揭秘

作者：firebare 2010-06-04 17:03:17

Hadoop這個名詞相信大家應該有所了解，那么關于Hadoop的實現你是否熟悉，這里就向大家介紹一下利用Cloudera 實現Hadoop方面的內容，歡迎大家一起來學習。

本節接著上節介紹Cloudera 實現Hadoop 的方法，本節主要介紹一下對Hadoop的相關設置，相信通過本節的介紹大家對Cloudera 實現Hadoop 方法有一定的了解。

設置主節點的Hadoop

設置JAVA_HOME

Hadoop的JAVA_HOME是在文件/etc/conf/hadoop-env.sh中設置，具體設置如下：
sudo vi /etc/conf/hadoop-env.shexport JAVA_HOME="/usr/lib/jvm/java-6-sun"

Hadoop的核心配置

Hadoop的核心配置文件是/etc/hadoop/conf/core-site.xml，具體配置如下：
<?xml version="1.0"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>fs.default.name</name><value>hdfs://hadoop-01:8020</value></property><property><name>hadoop.tmp.dir</name><value>/var/lib/hadoop-0.20/cache/${user.name}</value></property></configuration>

設置Hadoop的分布式存儲環境

Cloudera 實現Hadoop 過程中Hadoop的分布式環境設置主要是通過文件/etc/hadoop/conf/hdfs-site.xml來實現的，具體配置如下：
<?xml version="1.0"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>dfs.replication</name><value>3</value></property><property><name>dfs.permissions</name><value>false</value></property><property><name>dfs.name.dir</name><value>/var/lib/hadoop-0.20/cache/hadoop/dfs/name</value></property></configuration>

設置Hapoop的分布式計算環境

Cloudera 實現Hadoop 過程中Hadoop的分布式計算是采用了Map/Reduce算法，該算法環境的設置主要是通過文件/etc/hadoop/conf/mapred-site.xml來實現的，具體配置如下：
<?xml version="1.0"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>mapred.job.tracker</name><value>hadoop-01:8021</value></property></configuration>

設置Hadoop的主從節點

首先設置主節點，編輯/etc/hadoop/conf/masters文件，如下所示：
hadoop-01然后是設置從節點，編輯/etc/hadoop/conf/slaves文件，如下所示：
hadoop-02hadoop-03hadoop-04firehare-303

設置從節點上的Hadoop

從節點上的Hadoop設置很簡單，只需要將主節點上的Hadoop設置，復制一份到從節點上即可。
scp -r /etc/hadoop/conf hadoop-02:/etc/hadoopscp -r /etc/hadoop/conf hadoop-03:/etc/hadoopscp -r /etc/hadoop/conf hadoop-04:/etc/hadoopscp -r /etc/hadoop/conf firehare-303:/etc/hadoop。Cloudera 實現Hadoop過程中對Hadoop配置完以后需要啟動Hadoop服務。

啟動Hadoop

格式化分布式文件系統
在啟動Hadoop之前還要做***一個準備工作，那就是格式化分布式文件系統，這個只需要在主節點做就行了，具體如下：
/usr/lib/hadoop-0.20/bin/hadoop namenode -format

啟動Hadoop服務

啟動Hadoop可以通過以下命令來實現：
/usr/lib/hadoop-0.20/bin/start-all.sh注意：該命令是沒有加sudo的，如果加了sudo就會提示出錯信息的，因為root用戶并沒有做無驗證ssh設置。以下是輸出信息，注意hadoop-03是故意沒接的，所以出現No route to host信息。這樣Hadoop就正常啟動了！

測試Hadoop

Hadoop架設好了，接下來就是要對其進行測試，看看它是否能正常工作，如果測試已經成功，這說明Hadoop部署成功，能夠在上面進行Map/Reduce分布性計算了。本節關于Cloudera 實現Hadoop的相關內容到這里就結束了，謝謝關注。

【編輯推薦】

Cloudera實現Hadoop步驟詳解
Cloudera下實現Hadoop方案規劃
專家講解 Hadoop:HBASE松散數據存儲設計
兩種模式運行Hadoop分布式并行程序
Hadoop應用之Hadoop安裝篇

責任編輯：佚名來源： csdn.net

實現Hadoop

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Cloudera實現Hadoop過程中Hadoop設置揭秘