在 Ubuntu16.04 中搭建 Spark 单机开发环境 (JDK + Scala + Spark)

Posted Li Baoquan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在 Ubuntu16.04 中搭建 Spark 单机开发环境 (JDK + Scala + Spark)相关的知识,希望对你有一定的参考价值。

1.准备

本文主要讲述如何在Ubuntu 16.04 中搭建 Spark 2.11 单机开发环境,主要分为 3 部分:JDK 安装,Scala 安装和 Spark 安装。

  1. JDK 1.8:jdk-8u171-linux-x64.tar.gz
  2. Scala 11.12:Scala 2.11.12
  3. Spark 2.2.1:spark-2.2.1-bin-hadoop2.7.tgz

需要注意的是,Spark 版本与 Scala 版本需要匹配一致。

Note: Starting version 2.0, Spark is built with Scala 2.11 by default. Scala 2.10 users should download the Spark source package and build with Scala 2.10 support.

2.JDK 安装

下载 jdk-8u171-linux-x64.tar.gz 后,解压到自己指定目录。

$ sudo mkdir /usr/local/java
$ sudo tar -zxvf jdk-8u171-linux-x64.tar.gz -C /usr/local/java

配置环境变量,打开 profile 文件

$ sudo gedit /etc/profile

在文件末尾写入,注意 JAVA_HOME 是 JDK 的安装路径:

export JAVA_HOME=/usr/local/java/jdk1.8.0_171 
export JRE_HOME=${JAVA_HOME}/jre 
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib 
export PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin:$PATH 

保存后退出,运行如下命令,使修改环境变量即可生效:

$ source /etc/profile

检测java是否成功安装

$ java -version

3.Scala 安装

下载 Scala 2.11.12 后,解压到自己指定目录。

$ sudo mkdir /usr/local/scala
$ sudo tar -zxvf scala-2.11.12.tgz -C /usr/local/scala

配置环境变量,打开 profile 文件

$ sudo gedit /etc/profile

在文件末尾写入,注意 SCALA_HOME 是 Scala 的安装路径:

export SCALA_HOME=/usr/local/scala/scala-2.11.12 
export PATH=${SCALA_HOME}/bin:$PATH

保存后退出,运行如下命令,使修改环境变量即可生效:

$ source /etc/profile

检测java是否成功安装

$ scala  -version

4.Spark 安装

下载 spark-2.2.1-bin-hadoop2.7.tgz 后,解压到自己指定目录。

$ sudo mkdir /usr/local/spark
$ sudo tar -zxvf spark-2.2.1-bin-hadoop2.7.tgz -C /usr/local/spark

配置环境变量,打开 profile 文件

$ sudo gedit /etc/profile

在文件末尾写入,注意 SPARK_HOME 是 Spark 的安装路径:

export SPARK_HOME=/usr/local/spark/spark-2.2.1-bin-hadoop2.7
export PATH=${SPARK_HOME}/bin:$PATH 

保存后退出,运行如下命令,使修改环境变量即可生效:

$ source /etc/profile

检测java是否成功安装

$ spark-shell

以上是关于在 Ubuntu16.04 中搭建 Spark 单机开发环境 (JDK + Scala + Spark)的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop(伪分布式)+Spark(local模式)搭建Hadoop和Spark组合环境

Ubuntu 16.04 + PyCharm + spark 运行环境配置

Ubuntu 16.04 + PyCharm + spark 运行环境配置

spark集群详细搭建过程及遇到的问题解决

ubuntu16.04搭建gitlab

ubuntu 16.04 Samba服务器搭建