Spark IMF传奇行动第17课Transformations实战总结

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark IMF传奇行动第17课Transformations实战总结相关的知识,希望对你有一定的参考价值。

今晚听了王家林老师的Spark IMF传奇行动第17课Transformations实战,作业是用SCALA写cogroup:

def main(args: Array[String]): Unit = {
    val sc = sparkContext("Transformations")

    cogroupTrans(sc)

    sc.stop() 
}
def cogroupTrans(sc:SparkContext): Unit ={
    val stuNames = Array(
      Tuple2(1,"Spark"),
      Tuple2(2,"Tecc"),
      Tuple2(3,"Hadoop")
    )
    val stuScores = Array(
      Tuple2(1,100),
      Tuple2(1,99),
      Tuple2(2,95),
      Tuple2(3,65)
    )
    val names = sc.parallelize(stuNames)
    val scores = sc.parallelize(stuScores)
    val stuNameAndScore = names.cogroup(scores)
    stuNameAndScore.collect().foreach(println)
}

后续课程可以参照新浪微博 王家林_DT大数据梦工厂:http://weibo.com/ilovepains

王家林  中国Spark第一人,微信公共号DT_Spark

 

转发请写明出处。

以上是关于Spark IMF传奇行动第17课Transformations实战总结的主要内容,如果未能解决你的问题,请参考以下文章

Spark IMF传奇行动第20课:top N总结

Spark IMF传奇行动第21课:从Spark架构中透视Job

Spark IMF传奇行动第18课:RDD持久化广播累加器总结

Spark IMF传奇行动第22课:RDD的依赖关系彻底解密

[Spark传奇行动] 第34课:Stage划分和Task最佳位置算法源码彻底解密

Spark 从入门到精通学习笔记大纲