spark大数据处理之hello world

Posted 分歧者

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark大数据处理之hello world相关的知识,希望对你有一定的参考价值。

Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,关于它的介绍网上随便一搜都是一大堆,在此就不再赘述了。

 

Spark的开发是基于scala语言的,属于java和js的综合体,知晓java及js的同学应该都是很容易上手的。

 

开发一个spark的程序一般用专门的IDE,叫做Scala IDE for Eclipse,和开发java的界面差不多。

 

下面我们就用图文来说明,如何开发出第一个spark的程序。

一 切换到scala开发环境

 

                                                                           (一)点击其中红色箭头所指的按钮,切换到scala开发环境

二 新建scala工程

                                                                              (二) 新建一个Scala工程

 

三 新建一个scala object

                                                                              (三)新建一个scala Object

四 写入打印代码

         

package first.helloworld

object HelloWorld {
def main(args:Array[String]){
println("hello world");
}
}

 

五 导成jar包,提交到spark环境运行

    spark-submit --class first.helloworld.HelloWorld   --master spark://ha-test:7077 first.jar

 

六 查看运行结果

    不出意外,大功告成,没错,就那么简单!比起网上动不动就上万的培训费,是不是感觉一万个草泥马在奔腾呢!

以上是关于spark大数据处理之hello world的主要内容,如果未能解决你的问题,请参考以下文章

mapreduce输入数据为helloworldbyword的切片处理结果

[大数据从入门到放弃系列教程]在IDEA的Java项目里,配置并加入Scala,写出并运行scala的hello world

大数据之路week01--自学之集合_2(Iterator迭代器)

大数据之Spark:Spark Streaming

大数据进阶之Spark计算运行流程

大数据之Spark:Spark Streaming