Spark集群搭建

Posted 2021-01-19 dtstack

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Spark集群搭建相关的知识，希望对你有一定的参考价值。

Spark集群搭建

一、环境说明
1、机器：3台虚机(hadoop01/hadoop02/hadoop03)
2、Linux版本：CentOS 6.5
3、JDK版本：1.8
4、Hadoop版本：hadoop-2.5.2
5、Spark版本：Spark-1.3.1
6、Scala版本：scala-2.10.6
二、安装步骤
1、安装Hadoop,这里不做具体讲解
172.16.1.156 hadoop01
172.16.1.157 hadoop02
172.16.1.158 hadoop03
2、下载Spark
如果是基于Hadoop部署spark,可以对应hadoop的版本下载spark
下载地址：http://spark.apache.org/downloads.html
3、下载Scala
下载地址：http://www.scala-lang.org/download/2.10.6.html

4、安装Scala
解压:tar -zxvf scala-2.10.6.tgz

5.安装spark
解压：tar -zxvf spark-1.3.1-bin-hadoop2.4.tgz

6、在~/.bash_profile中配置环境变量
QQ截图20160427162720.png

7、配置spark_env.sh(Spark运行的环境变量)
修改spark_env.sh.template复制为spark_env.sh
mv spark_env.sh.template spark_env.sh
技术分享图片
配置以上环境变量
export JAVA_HOME=/home/hadoop/jdk1.8
export SPARK_MASTER_IP=spark01
export SPARK_MASTER_PORT=7077
export SPARK_WORKER_CORES=1
export SPARK_WORKER_INSTANCES=1

8、复制hadoop01节点配置好的spark到其他节点
scp -r ~/spark-1.3.1-bin-hadoop2.4/ [email protected]:~/
scp -r ~/spark-1.3.1-bin-hadoop2.4/ [email protected]:~/

9.spark的web管理界面：http://172.16.1.156:8080/
spark WEBUI界面：http://172.16.1.156:4040/jobs/

spark-shell启动：
到spark的bin目录下执行 ./spark-shell
技术分享图片

以上是关于Spark集群搭建的主要内容，如果未能解决你的问题，请参考以下文章

华为云Hadoop与Spark集群环境搭建

spark的HA集群搭建

使用 Docker 搭建 Hadoop 集群和 Spark On Yarn

Spark 系列—— 基于 ZooKeeper 搭建 Spark 高可用集群

Spark集群搭建