spark实现wordcount

Posted timlong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark实现wordcount相关的知识,希望对你有一定的参考价值。

spark-shell --master yarn
sc:
val lineRDD=sc.textFile("/test/input/test")
lineRDD.collect().foreach(println)
val wordRDD = lineRDD
wordRDD.collect().foreach(println)
val wordcountRDD = wordRDD.map(x=>(x,1))
wordcountRDD.collect().foreach(println)
val resultRDD = wordcountRDD.reduceByKey((x,y)=>x+y)
resultRDD.collect().foreach(println)
val orderedRDD = resultRDD.sortByKey()
orderedRDD.collect().foreach(println)












以上是关于spark实现wordcount的主要内容,如果未能解决你的问题,请参考以下文章

怎样利用Spark Streaming和Hadoop实现近实时的会话连接

spark实现UserCF

大数据算法设计模式 - topN spark实现

Spark实现tf-idf

Spark版本定制七:Spark Streaming源码解读之JobScheduler内幕实现和深度思考

spark-scala-java实现wordcount