大数据平台 Hadoop 的分布式集群环境搭建

Posted OSC开源社区

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据平台 Hadoop 的分布式集群环境搭建相关的知识,希望对你有一定的参考价值。


1 概述


本文章介绍大数据平台Hadoop的分布式环境搭建、以下为Hadoop节点的部署图,将NameNode部署在master1,SecondaryNameNode部署在master2,slave1、slave2、slave3中分别部署一个DataNode节点


大数据平台 Hadoop 的分布式集群环境搭建


NN=NameNode(名称节点)

SND=SecondaryNameNode(NameNode的辅助节点)

DN=DataNode(数据节点)


2 前期准备


(1)准备五台服务器


如:master1、master2、slave1、slave2、slave3


(2)关闭所有服务器的防火墙


大数据平台 Hadoop 的分布式集群环境搭建


(3)分别修改各服务器的/etc/hosts文件,内容如下:


大数据平台 Hadoop 的分布式集群环境搭建


注:对应修改个服务器的/etc/hostname文件,分别为 master1、master2、slave1、slave2、slave3


(4)分别在各台服务器创建一个普通用户与组


大数据平台 Hadoop 的分布式集群环境搭建


切换至hadoop用户:su hadoop


(5)各服务器间的免密码登录配置,分别在各自服务中执行一次


大数据平台 Hadoop 的分布式集群环境搭建


注:以上操作需要登录到hadoop用户操作


(6)下载hadoop包,hadoop-2.7.5.tar.gz



3 开始安装部署


(1)创建hadoop安装目录


大数据平台 Hadoop 的分布式集群环境搭建


(2)将安装包解压至/home/hadoop/app/hadoop下


大数据平台 Hadoop 的分布式集群环境搭建


(3)配置hadoop的环境变量,修改/etc/profile


大数据平台 Hadoop 的分布式集群环境搭建


(4)刷新环境变量


大数据平台 Hadoop 的分布式集群环境搭建


4 配置Hadoop


(1)配置core-site.xml


大数据平台 Hadoop 的分布式集群环境搭建



(2)配置hdfs-site.xml


大数据平台 Hadoop 的分布式集群环境搭建

大数据平台 Hadoop 的分布式集群环境搭建



(3)配置mapred-site.xml


$ cp /home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/mapred-site.xml.template /home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/mapred-site.xml

$ vi /home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/mapred-site.xml


大数据平台 Hadoop 的分布式集群环境搭建



(4)配置yarn-site.xml


大数据平台 Hadoop 的分布式集群环境搭建

大数据平台 Hadoop 的分布式集群环境搭建



(5)配置slaves


大数据平台 Hadoop 的分布式集群环境搭建


slaves文件中配置的是DataNode的所在节点服务


(6)配置hadoop-env


修改hadoop-env.sh文件的JAVA_HOME环境变量,操作如下:


大数据平台 Hadoop 的分布式集群环境搭建


(7)配置yarn-env


修改yarn-env.sh文件的JAVA_HOME环境变量,操作如下


大数据平台 Hadoop 的分布式集群环境搭建


(8)配置mapred-env


修改mapred-env.sh文件的JAVA_HOME环境变量,操作如下:


大数据平台 Hadoop 的分布式集群环境搭建


(9)将master1中配置好的hadoop分别远程拷贝至maser2、slave1 、slave2、slave3服务器中


大数据平台 Hadoop 的分布式集群环境搭建


5 启动测试


(1)在master1节点中初始化Hadoop集群


大数据平台 Hadoop 的分布式集群环境搭建


(2)启动Hadoop集群


大数据平台 Hadoop 的分布式集群环境搭建


(3)验证集群是否成功


浏览器中访问50070的端口,如下证明集群部署成功


大数据平台 Hadoop 的分布式集群环境搭建

大数据平台 Hadoop 的分布式集群环境搭建

大数据平台 Hadoop 的分布式集群环境搭建


推荐阅读



点击“阅读原文”查看更多精彩内容

以上是关于大数据平台 Hadoop 的分布式集群环境搭建的主要内容,如果未能解决你的问题,请参考以下文章

大数据平台 Hadoop 的分布式集群环境搭建

大数据分析师实操练习(Hadoop完全分布式集群搭建)

Spark + Kafka大数据环境的搭建和示例的简单运行

大数据实战——hadoop集群安装搭建

大数据实战之Centos搭建完全分布式Hadoop集群

大数据技术栈-Hadoop3.3.4-完全分布式集群搭建部署-centos7(完全超详细-小白注释版)虚拟机安装+平台部署