云/大数据      Ubuntu10.04×64搭建Hadoop2.7.0×64分布式集群   
文章目录  [隐藏]

相关资源下载:
  见 http://www.gaohaiyan.com/1355.html 篇尾


Oracle VM VirtualBox下载地址:
   https://www.virtualbox.org/wiki/Downloads
ubuntu10.04x64下载地址:
   http://download.chinaunix.net/down.php?id=31672&ResourceID=12776&site=6
OpenSSH,client、server、all下载地址:
   http://archive.ubuntu.com/ubuntu/pool/main/o/openssh/
JDK下载地址:
   http://www.oracle.com/technetwork/java/javase/downloads/index.html
Hadoop下载地址:
   http://www.apache.org/dyn/closer.cgi/hadoop/common/


在VirtualBox虚拟机软件中安装ubuntu系统,配置SSH、JDK、安置Hadoop程序,参考:
   http://my.oschina.net/vigiles/blog/132244


Hadoop1.1.2集群配置参考:
   http://my.oschina.net/vigiles/blog/132559
Hadoop2.3.0集群配置参考:
   http://www.cnblogs.com/vigiles/p/3607145.html
   http://my.oschina.net/vigiles/blog/208430

---------------------------------------------------------------------------------------------------------


本例说明:
ubuntu10.04x64主机共3台:
  一台master主控机,配置为NameNode、SecondaryNameNode;
  两台slave从属机, 配置为NodeManager、DataNode。
3台主机都在相同的路径下安装jdk-7u80-linux-x64、安置hadoop2.7.0程序、配置环境变量。

----------------------------------------------------------------------------------------------------------

一。主机设定

1.主机名、IP




用到的命令语句:
gedit /etc/hostname
gedit /etc/hosts


gedit /etc/network/interfaces


/etc/init.d/networking restart

2.环境变量

gedit /etc/profile


source /etc/profile

3.SSH

本例使用的文件:
openssh-client_5.3p1-3ubuntu3_amd64.deb
openssh-server_5.3p1-3ubuntu3_amd64.deb
ssh_5.3p1-3ubuntu3_all.deb


首先,在master上执行:
ssh-keygen
cp id_rsa.pub authorized_keys
scp authorized_keys root@slave1:/root/.ssh/

然后,在slave1上执行:
ssh-keygen
cat id_rsa.pub >> authorized_keys
scp authorized_keys root@slave2:/root/.ssh/

接着,在slave2上执行:
ssh-keygen
cat id_rsa.pub >> authorized_keys

最后,替换master和slave1上的密钥文件。最好先在master和slave上删除之。
scp -rpv authorized_keys root@slave1:/root/.ssh/
scp -rpv authorized_keys root@slave2:/root/.ssh/


可以 ssh 主机名 测试下,任意2台主机双向登录不要求密码即成功。

二。Hadoop配置

3台主机的hadoop配置是完全一样的。要配置的文件都在 %hadoop%/etc/hadoop/ 中。

1.core-site.xml

2.hadoop-env.sh

约在25行,找到

在行首添加#注释,或直接修改为

3.hdfs-site.xml

4.mapred-site.xml

5.slaves

把全部slave从属机的主机名写入即可。

6.yarn-env.sh

约23行左右,找到

修改为

7.yarn-site.xml


三。启动集群

以下都是在master主控机上执行的。

1.启动步骤

1)格式化HDFS系统
hdfs namenode -format

2)启动MRHDFS系统
start-dfs.sh

3)启动Yarn运算框架
start-yarn.sh

2.监控集群

1)hdfs dfsadmin -report
2)页面
http://192.168.1.240:50070 或 http://localhost:50070
http://192.168.1.240:8088/cluster 这个地址是在yarn-site.xml文件yarn.resourcemanager.webapp.address下配的。

-------------------------------------------------------------------------------------------------



3.停止集群

1.stop-yarn.sh
2.stop-dfs.sh


承接App定制、企业web站点、办公系统软件 设计开发,外包项目,毕设