第一个spark程序

Posted 2020-12-04 南边雪

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了第一个spark程序相关的知识，希望对你有一定的参考价值。

Scala开发，sbt打包，spark运行

1、创建文件目录结构：

2、创建Scala程序 SimpleAPP.Scala：

import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf               

object SimpleApp {
    def main(args: Array[String]) {
        val logFile = "file:///mnt/hgfs/share/resource/jitanjiali.docx"
       //Should be some file on your system
        val conf = new SparkConf().setAppName("Simple Application")
        val sc = new SparkContext(conf)
        val logData = sc.textFile(logFile, 2).cache()
        val numAs = logData.filter(line => line.contains(\'a\')).count()
        val numBs = logData.filter(line => line.contains(\'b\')).count()
        println("Lines with a : %s, Lines with b: %s".format(numAs, numBs)) 
    }
}

3、使用sbt打包Scala程序

该程序依赖 Spark API，因此需要通过 sbt 进行编译打包。在./sparkapp 中新建文件 simple.sbt，添加如下内容，声明该独立应用程序的信息以及与 Spark 的依赖关系：