spark - 从HDFS加载文件并分析
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark - 从HDFS加载文件并分析相关的知识,希望对你有一定的参考价值。
scala> val file=sc.textFile("/workspace/bpUserinfo_logs/bpUserinfo_20160212.log")
scala> val count=file.flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_)
scala> count.collect().map(print)
以上是关于spark - 从HDFS加载文件并分析的主要内容,如果未能解决你的问题,请参考以下文章
使用 spark/scala 从 HDFS 目录中获取所有 csv 文件名
在本地文件系统(不是HDFS)中使用Scala读取Apache Spark中的文件时如何更改输入块大小[重复]