spark - 从HDFS加载文件并分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark - 从HDFS加载文件并分析相关的知识,希望对你有一定的参考价值。

scala> val file=sc.textFile("/workspace/bpUserinfo_logs/bpUserinfo_20160212.log")  

scala> val count=file.flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_)  

scala> count.collect().map(print) 

以上是关于spark - 从HDFS加载文件并分析的主要内容,如果未能解决你的问题,请参考以下文章

使用 spark/scala 从 HDFS 目录中获取所有 csv 文件名

使用 scala 从 HDFS 读取输入 xml 数据

scala怎么读取hdfs中的文件

在本地文件系统(不是HDFS)中使用Scala读取Apache Spark中的文件时如何更改输入块大小[重复]

在 Spark/Scala 中写入 HDFS,读取 zip 文件

如何使用 Spark/Scala 在 HDFS 上编写/创建 zip 文件?