VMware部署Spark集群

Posted 2021-04-27 WOOAI

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了VMware部署Spark集群相关的知识，希望对你有一定的参考价值。

VMware克隆虚拟机

VMware部署Spark集群

设置网卡

VMware部署Spark集群

HostName	ip
master	192.168.94.128
data1	192.168.94.129
date2	192.168.94.130

VMware部署Spark集群

设置data1虚机

设置hostname

sudo gedit /etc/hostname

VMware部署Spark集群

设置hosts文件

sudo gedit /etc/hosts

VMware部署Spark集群

192.168.94.128 master
192.168.94.129 data1
192.168.94.130 data2

VMware部署Spark集群

设置core-size.xml

sudo gedit /usr/local/hadoop/hadoop-2.9.2/etc/hadoop/core-site.xml

<configuration>
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://master:9000</value>
	</property>
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/usr/local/hadoop/tmp</value>
	</property>
</configuration>

设置hdfs-site.xml

sudo gedit /usr/local/hadoop/hadoop-2.9.2/etc/hadoop/hdfs-site.xml

<configuration>
	<property>
             <name>dfs.replication</name>
             <value>1</value>
        </property>
        <property>
            <name>dfs.datanode.data.dir</name>      
            <value>file:/usr/local/hadoop/tmp/dfs/data</value>
        </property>
</configuration>

重启设置生效

reboot

设置data2虚机

相关步骤与设置data1一致，不再赘述。注意hostname要与之虚机相对应，相对应即可！

设置master虚机

设置hostname

sudo gedit /etc/hostname

VMware部署Spark集群

设置hosts文件

sudo gedit /etc/hosts

VMware部署Spark集群

192.168.94.128 master
192.168.94.129 data1
192.168.94.130 data2

VMware部署Spark集群

设置hdfs-site.xml

sudo gedit /usr/local/hadoop/hadoop-2.9.2/etc/hadoop/hdfs-site.xml

<configuration>
	<property>
             <name>dfs.replication</name>
             <value>1</value>
        </property>
        <property>
             <name>dfs.namenode.name.dir</name>
             <value>file:/usr/local/hadoop/tmp/dfs/name</value>
        </property>
</configuration>

设置master文件

sudo gedit /usr/local/hadoop/hadoop-2.9.2/etc/hadoop/masters

VMware部署Spark集群

设置slaves文件

sudo gedit /usr/local/hadoop/hadoop-2.9.2/etc/hadoop/slaves

VMware部署Spark集群

重启设置生效

reboot

master连接到data1、data2创建HDFS目录

启动master、data1、data2服务器

VMware部署Spark集群

连接到data1虚机

ssh data1

VMware部署Spark集群

连接到data1创建HDFS相关目录

# 删除HDFS所有目录
sudo rm -rf /usr/local/hadoop/tmp/dfs
# 创建DataNode存储目录
mkdir -p /usr/local/hadoop/tmp/dfs/data
# 将目录的所有者改为ubuntu（用户名）
sudo chown -R ubuntu:ubuntu /usr/local/hadoop/

中断data1连接，回到master

exit

VMware部署Spark集群

连接到data2虚机

相关步骤与连接到data1一致，不再赘述。

master创建并格式化NameNone HDFS

重新创建NameNone HDFS 目录

# 删除HDFS所有目录
sudo rm -rf /usr/local/hadoop/tmp/dfs
# 创建DataNode存储目录
mkdir -p /usr/local/hadoop/tmp/dfs/name
# 将目录的所有者改为ubuntu（用户名）
sudo chown -R ubuntu:ubuntu /usr/local/hadoop/

格式化NameNone HDFS 目录

hadoop namenode -format

VMware部署Spark集群

启动 Hadoop Multi Node Cluster

start-all.sh

VMware部署Spark集群

查看master(NameNode)进程

jps

VMware部署Spark集群

查看data1(DataNode)的进程

# SSH连接到data1
ssh data1
# 查看所运行的进程
jps
# 回到master
exit

VMware部署Spark集群

查看data2(DataNode)的进程

# SSH连接到data2
ssh data2
# 查看所运行的进程
jps
# 回到master
exit

VMware部署Spark集群

打开Hadoop ResourceManager Web 界面

http://master:8088

VMware部署Spark集群

打开NameNode Web 界面

http://master:50070

VMware部署Spark集群

创建与查看HDFS目录

# 创建多级目录
hadoop fs -mkdir -p /user/ubuntu/movie
# 查看所有目录
hadoop fs -ls -R /
# 上传
hadoop fs -put ./movie/data /user/ubuntu/movie/data
# 删除目录
hadoop fs -rm -R /user/ubuntu/movie/data

http://master:50070/explorer.html

以上是关于VMware部署Spark集群的主要内容，如果未能解决你的问题，请参考以下文章

在VMware上搭建Spark集群

Hadoop集群+Spark集群搭建基于VMware虚拟机教程

Hadoop集群+Spark集群搭建基于VMware虚拟机教程+安装运行Docker

06部署Spark程序到集群上运行

VMware部署Spark集群

相关介绍

VMware克隆虚拟机

设置网卡

设置data1虚机

设置hostname

设置hosts文件

设置core-size.xml

设置hdfs-site.xml

重启设置生效

设置data2虚机

设置master虚机

设置hostname

设置hosts文件

设置hdfs-site.xml

设置master文件

设置slaves文件

重启设置生效

master连接到data1、data2创建HDFS目录

启动master、data1、data2服务器

连接到data1虚机

连接到data1创建HDFS相关目录

中断data1连接，回到master

连接到data2虚机

master创建并格式化NameNone HDFS

重新创建NameNone HDFS 目录

格式化NameNone HDFS 目录

启动 Hadoop Multi Node Cluster

查看master(NameNode)进程

查看data1(DataNode)的进程

查看data2(DataNode)的进程

打开Hadoop ResourceManager Web 界面

打开NameNode Web 界面

创建与查看HDFS目录