centos7下hadoop3.0搭建文档

Posted 2020-10-10

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了centos7下hadoop3.0搭建文档相关的知识，希望对你有一定的参考价值。

一准备资源和环境

下载Centos 7.2 的iso安装镜像，jdk1.8 for Linux压缩包，hadoop3.0.0压缩包。下载链接分别如下:

https://www.centos.org/download/

http://www.Oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

http://hadoop.apache.org/releases.html

如下：

[[email protected] home]# ls

hadoop-3.0.0-alpha4 hadoop-3.0.0-alpha4.tar.gz jdk-8u101-linux-x64.rpm

[[email protected] home]#

准备三台centos7的系统：

Master:192.168.161.133

Slave1:192.168.161.135

Slave2:192.168.161.136

二安装jdk和hadoop

1 安装jdk

rpm -ivh jdk-8u101-linux-x64.rpm

查看jdk安装目录

rpm -qal|grep java

2 安装hadoop

进入home目录，直接解压hadoop即可

tar -zvxf hadoop-3.0.0-alpha4.tar.gz

3. 环境变量

vi /etc/profile

#Hadoop 3.0
export HADOOP_HOME=/home/hadoop-3.0.0-alpha4
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile

注意：/home/hadoop-3.0.0-alpha4为解压路径

三配置hadoop

先在192.168.161.133上面配置hadoop，然后scp到slave上。

hadoop3.0需要配置的文件有core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml、hadoop-env.sh、workers

新建目录：

cd /home/hadoop-3.0.0-alpha4

mkdir tmp

mkdir -p hdfs/{data,name}

1 core-site.xml配置文件

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>file:///home/hadoop-3.0.0-alpha4/tmp</value>

</property>

</configuration>

2 hdfs-site.xml配置文件

<name>dfs.replication</name>

</property>

<name>dfs.namenode.name.dir</name>

<value>file:///home/hadoop-3.0.0-alpha4/hdfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:///home/hadoop-3.0.0-alpha4/hdfs/data</value>

</property>

<name>dfs.namenode.secondary.http-address</name>

</property>

</configuration>

3 works

192.168.161.135

192.168.161.136

4 mapred-site配置

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.application.classpath</name>

<value>

/home/hadoop-3.0.0-alpha4/etc/hadoop,

/home/hadoop-3.0.0-alpha4/share/hadoop/common/*,

/home/hadoop-3.0.0-alpha4/share/hadoop/common/lib/*,

/home/hadoop-3.0.0-alpha4/share/hadoop/hdfs/*,

/home/hadoop-3.0.0-alpha4/share/hadoop/hdfs/lib/*,

/home/hadoop-3.0.0-alpha4/share/hadoop/mapreduce/*,

/home/hadoop-3.0.0-alpha4/share/hadoop/mapreduce/lib/*,

/home/hadoop-3.0.0-alpha4/share/hadoop/yarn/*,

/home/hadoop-3.0.0-alpha4/share/hadoop/yarn/lib/*

</value>

</property>

</configuration>

5 yarn-site.xml配置

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandle</value>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

</property>

<name>yarn.resourcemanager.address</name>

</property>

</configuration>

6 hadoop-env.sh中配置java_home

export JAVA_HOME=/usr/java/jdk1.8.0_101

7 将配置好的hadoop文件夹传输到slave上面

cd /home/

scp -r hadoop-3.0.0-alpha4 [email protected]:/home/

四启动hadoop

1. 格式化namenode

bin/hdfs namenode -format

2. 启动dfs及yarn

sbin/start-dfs.sh

sbin/start-yarn.sh

启动会报错，解决方法：

2.1 sbin/start-dfs.sh 报错：

是因为缺少用户定义造成的，所以分别编辑开始和关闭脚本
vim sbin/start-dfs.sh
vim sbin/stop-dfs.sh
在顶部空白处添加内容：
HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

2.2 sbin/start-yarn.sh 报错

是因为缺少用户定义造成的，所以分别编辑开始和关闭脚本
$ vim sbin/start-yarn.sh
$ vim sbin/stop-yarn.sh

在顶部空白处添加内容：

YARN_RESOURCEMANAGER_USER=root

HADOOP_SECURE_DN_USER=yarn

YARN_NODEMANAGER_USER=root

2.3 可以采用另外一种方法启动

启动hadoop

首先格式化主节点命名空间，使用命令：

/home/joe/hadoop-3.0.0-alpha1/bin/hdfsnamenode –formate

其次在主节点上启动存储服务和资源管理主服务。使用命令：

/home/joe/hadoop-3.0.0-alpha1/sbin/hadoop-daemon.sh start namenode #启动主存储服务

/home/joe/hadoop-3.0.0-alpha1/sbin/yarn-daemon.sh start resourcemanager # 启动资源管理服务。

最后在从节点上启动存储从服务和资源管理从服务（以下两条命令要在两台机器上分别执行）

/home/joe/hadoop-3.0.0-alpha1/sbin/hadoop-daemon.sh start datanode #启动从存储服务

/home/joe/hadoop-3.0.0-alpha1/sbin/yarn-daemon.sh start nodemanager #启动资源管理从服务

3 通过jps命令查看

master：

[[email protected] hadoop-3.0.0-alpha4]# jps

3842 ResourceManager

4217 Jps

2766 NameNode

[[email protected] hadoop-3.0.0-alpha4]#

Slave1：

[[email protected] home]# jps

2561 DataNode

3333 Jps

3224 NodeManager

2621 SecondaryNameNode

[[email protected] home]#

Slave2:

[[email protected] home]# jps

3256 Jps

2955 DataNode

3084 NodeManager

[[email protected] home]#

4现在便可以打开页面http://192.168.161.133:8088及http://192.168.161.133:9870；看到下面两个页面时说明安装成功。

五借鉴网址：

http://blog.csdn.net/u010499619/article/details/52886872

http://www.linuxidc.com/Linux/2016-11/137244.htm

http://blog.csdn.net/u013725455/article/details/70147331

http://www.linuxidc.com/Linux/2016-10/136166.htm

以上是关于centos7下hadoop3.0搭建文档的主要内容，如果未能解决你的问题，请参考以下文章

centos7下hadoop3.0搭建文档

一 准备资源和环境

二安装jdk和hadoop

三配置hadoop

1 core-site.xml配置文件

2 hdfs-site.xml配置文件

3 works

4 mapred-site配置

5 yarn-site.xml配置

6 hadoop-env.sh中配置java_home

7 将配置好的hadoop文件夹传输到slave上面

四 启动hadoop

1. 格式化namenode

2. 启动dfs及yarn

2.1 sbin/start-dfs.sh 报错：

2.2 sbin/start-yarn.sh 报错

2.3 可以采用另外一种方法启动

3 通过jps命令查看

4现在便可以打开页面http://192.168.161.133:8088及http://192.168.161.133:9870；看到下面两个页面时说明安装成功。

五借鉴网址：

一准备资源和环境

四启动hadoop