用阿里云三个ECS服务器搭建一个小模拟Hadoop集群(三个不同账号的阿里云,相同区域或不同区域)步骤整理
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用阿里云三个ECS服务器搭建一个小模拟Hadoop集群(三个不同账号的阿里云,相同区域或不同区域)步骤整理相关的知识,希望对你有一定的参考价值。
检查hosts和网卡配置
把三台小服务器先做内网互通
内网互通参照阿里云安全通道配置
1、准备至少三个虚拟机
2、相互通信,生成密钥并发送
- 生成密钥(ssh-keygen -t rsa)
- 发送密钥ssh-copy-id [email protected] (需要先修改、etc\hosts 文件)
- 登录测试 ssh [email protected]
3、安装JDK和Hadoop
- jdk安装
- 上传jdk到vm1并解压(tar -zvxf jdk-7u67-linux-x64.tar.gz)
- 配置环境变量javahome,path,classpath(export JAVA_HOME=/home/vm1/jdk1.7.0_67 export PATH=$PATH:$JAVA_HOME/bin export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar)
- 刷新环境变量并测试(source .base_profile)
- hadoop安装
- 上传解压
- 配置环境变量hadoophome,path(export HADOOP_HOME=/home/vm1/hadoop-2.7.1 export PATH=$PATH:$HADOOP_HOME/bin)
- 刷新环境变量并测试(source .base_profile)
- 配置文件(配置文件目录:$HADOOP_HOME/etc/hadoop/)
- core--site.xml
- hdfs-site.xml
- mapred-site.xml
- yarn-site.xml
- slaves(集群节点)
- hadoop-env.sh(export JAVA_HOME=/home/hadoopadmin/jdk1.7.0_67)
4、格式化namenode
cd /home/vm1/hadoop-2.7.1/bin
chmod 744 *
hdfs namenode -format
5、启动Hadoop
cd /home/vm1/hadoop-2.7.1/sbin
chmod 744 *
./start-all.sh
core-site.xml
1 <configuration> 2 <!-- Hadoop文件系统依赖的基础配置 --> 3 <property> 4 <name>hadoop.tmp.dir</name> 5 <value>/home/hadoopadmin/hadoop/data</value> 6 </property> 7 <!-- NameNode结点的URI(包括协议、主机名称、端口号) --> 8 <property> 9 <name>fs.defaultFS</name> 10 <value>hdfs://*:8020</value> 11 </property> 12 </configuration>
hadoop-env.sh
export JAVA_HOME=java路径
hdfs-site.xml
<!-- Put site-specific property overrides in this file. --> <configuration> <!-- secondarynamenode的http服务器地址和端口 --> <property> <name>dfs.namenode.secondary.http-address</name> <value>172.17.204.171:50090</value> </property> <!-- 默认块复制 --> <property> <name>dfs.replication</name> <value>3</value> </property> <!-- 关闭权限校验 --> <property> <name>dfs.permissions</name> <value>false</value> </property> <!-- namenode的http服务器地址和端口 --> <property> <name>dfs.namenode.http-address</name> <value>172.17.204.171:50070</value> </property> <!-- datanode结点被指定要存储数据的本地文件系统路径 --> <property> <name>dfs.datanode.data.dir</name> <value>file:///home/hadoopadmin/hadoop/data/dfs/dn</value> </property> </configuration>
mapred-site.xml
<!-- Put site-specific property overrides in this file. --> <configuration> <!-- MapReduce JobHistory进程通信主机、端口 --> <property> <name>mapreduce.jobhistory.address</name> <value>172.17.204.171:10020</value> </property> <!-- MapReduce JobHistory的web界面主机、端口 --> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>172.17.204.171:19888</value> </property> <!-- 以yarn方式运行MapReduce --> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
slaves
vm01
vm02
vm03
以上是关于用阿里云三个ECS服务器搭建一个小模拟Hadoop集群(三个不同账号的阿里云,相同区域或不同区域)步骤整理的主要内容,如果未能解决你的问题,请参考以下文章
阿里云ECS服务器部署HADOOP集群:ZooKeeper 完全分布式集群搭建
阿里云ECS服务器部署HADOOP集群:HBase完全分布式集群搭建(使用外置ZooKeeper)