Linux下hadoop和spark的基础环境配置准备

Posted wowon

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux下hadoop和spark的基础环境配置准备相关的知识,希望对你有一定的参考价值。

我使用了4台虚拟机centos7来搭建环境,

  • 2个主结点(一般是一个,但为了体验zookeeper,万一其中一个master挂掉呢,另外一个会自动启动接管),
  • 2个从结点
  • 注意:下面的配置主要以主节点为例进行说明

第一步:同步四台机器的时钟

  sudo yum install ntpdate,确保已安装ntpdate,分别运行sudo ntpdate cn.pool.ntp.org

第二步:设置主机名

修改/etc/sysconfig/network文件,

NETWORKING = yes
HOSTNAME = master(主节点)

其实在centos7下面貌似已经失效,我是直接使用如下命令:

hostnamectl set-hostname master

记得reboot再进入第三步

第三步:关闭防火墙

  sudo systemctl stop firewalld

第四步:配置ip地址和主机名的对应关系

修改 /etc/hosts文件,把四个ip地址和主机名添加进去,如:

192.168.0.129 master

192.168.0.130 master02

192.168.0.131 slave01

192.168.0.132 slave02

保存退出,可以先暂时只配主节点的,等完成ssh免密登录后再拷贝到其他机器

第五步:配置ssh免密登录

主要是配置两个主节点可以免密登录到从节点,尽量不要从节点免密访问主节点,在主节点上运行如下命令:

ssh-keygen -t rsa

然后一路回车四次即可,然后就把公钥复制到其他节点

ssh-copy-id slave01,不要忘记给自己复制一份

第六步:安装jdk

  • 思路是在主节点安装好,然后直接复制到其他机器

创建一个文件夹mkdir /usr/java,将下载好的jdk包解压到该文件夹

pwd获取jdk文件路径,将其复制加入到环境变量,注意是普通不是root用户,

修改完之后,记得source .bash_profile才能生效。

如果运行java -version能够出现jdk版本信息,那么安装成功了。

-----

在一台上安装好了,把安装好的jdk文件夹,复制到其他机器上,

复制命令为:scp -r /usr/java root@slave01:/usr

同样需要设置环境变量(不用root)

-------------------------------------

到这里,就完成了基本的环境准备。

 

以上是关于Linux下hadoop和spark的基础环境配置准备的主要内容,如果未能解决你的问题,请参考以下文章

Ubuntu下搭建单机Hadoop和Spark集群环境

Hadoop-Scala-Spark环境安装

关于Linux下Spark的配置

hadoop课程设计

大数据常用软件安装指南

Spark MLlib速成宝典基础篇01Windows下spark开发环境搭建(Scala版)