大数据平台 Hadoop 的分布式集群环境搭建

Posted 2021-04-13 OSC开源社区

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了大数据平台 Hadoop 的分布式集群环境搭建相关的知识，希望对你有一定的参考价值。

1 概述

本文章介绍大数据平台Hadoop的分布式环境搭建、以下为Hadoop节点的部署图，将NameNode部署在master1，SecondaryNameNode部署在master2，slave1、slave2、slave3中分别部署一个DataNode节点

大数据平台 Hadoop 的分布式集群环境搭建

NN=NameNode（名称节点）

SND=SecondaryNameNode（NameNode的辅助节点）

DN=DataNode（数据节点）

2 前期准备

（1）准备五台服务器

如：master1、master2、slave1、slave2、slave3

（2）关闭所有服务器的防火墙

大数据平台 Hadoop 的分布式集群环境搭建

（3）分别修改各服务器的/etc/hosts文件，内容如下：

大数据平台 Hadoop 的分布式集群环境搭建

注：对应修改个服务器的/etc/hostname文件，分别为 master1、master2、slave1、slave2、slave3

（4）分别在各台服务器创建一个普通用户与组

大数据平台 Hadoop 的分布式集群环境搭建

切换至hadoop用户：su hadoop

（5）各服务器间的免密码登录配置，分别在各自服务中执行一次

大数据平台 Hadoop 的分布式集群环境搭建

注：以上操作需要登录到hadoop用户操作

（6）下载hadoop包，hadoop-2.7.5.tar.gz

3 开始安装部署

（1）创建hadoop安装目录

大数据平台 Hadoop 的分布式集群环境搭建

（2）将安装包解压至/home/hadoop/app/hadoop下

大数据平台 Hadoop 的分布式集群环境搭建

（3）配置hadoop的环境变量，修改/etc/profile

大数据平台 Hadoop 的分布式集群环境搭建

（4）刷新环境变量

大数据平台 Hadoop 的分布式集群环境搭建

4 配置Hadoop

（1）配置core-site.xml

大数据平台 Hadoop 的分布式集群环境搭建

（2）配置hdfs-site.xml

大数据平台 Hadoop 的分布式集群环境搭建

大数据平台 Hadoop 的分布式集群环境搭建

（3）配置mapred-site.xml

$ cp /home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/mapred-site.xml.template /home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/mapred-site.xml

$ vi /home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/mapred-site.xml

大数据平台 Hadoop 的分布式集群环境搭建

（4）配置yarn-site.xml

大数据平台 Hadoop 的分布式集群环境搭建

大数据平台 Hadoop 的分布式集群环境搭建

（5）配置slaves

大数据平台 Hadoop 的分布式集群环境搭建

slaves文件中配置的是DataNode的所在节点服务

（6）配置hadoop-env

修改hadoop-env.sh文件的JAVA_HOME环境变量，操作如下：

大数据平台 Hadoop 的分布式集群环境搭建

（7）配置yarn-env

修改yarn-env.sh文件的JAVA_HOME环境变量，操作如下

大数据平台 Hadoop 的分布式集群环境搭建

（8）配置mapred-env

修改mapred-env.sh文件的JAVA_HOME环境变量，操作如下：

大数据平台 Hadoop 的分布式集群环境搭建

（9）将master1中配置好的hadoop分别远程拷贝至maser2、slave1 、slave2、slave3服务器中

大数据平台 Hadoop 的分布式集群环境搭建

5 启动测试

（1）在master1节点中初始化Hadoop集群

大数据平台 Hadoop 的分布式集群环境搭建

（2）启动Hadoop集群

大数据平台 Hadoop 的分布式集群环境搭建

（3）验证集群是否成功

浏览器中访问50070的端口，如下证明集群部署成功

大数据平台 Hadoop 的分布式集群环境搭建

大数据平台 Hadoop 的分布式集群环境搭建

大数据平台 Hadoop 的分布式集群环境搭建

推荐阅读

点击“阅读原文”查看更多精彩内容

以上是关于大数据平台 Hadoop 的分布式集群环境搭建的主要内容，如果未能解决你的问题，请参考以下文章

大数据平台 Hadoop 的分布式集群环境搭建

大数据分析师实操练习（Hadoop完全分布式集群搭建）

Spark + Kafka大数据环境的搭建和示例的简单运行

大数据实战——hadoop集群安装搭建

大数据实战之Centos搭建完全分布式Hadoop集群

大数据技术栈-Hadoop3.3.4-完全分布式集群搭建部署-centos7（完全超详细-小白注释版）虚拟机安装+平台部署