03Spark RDD编程基础

Posted 123wen

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了03Spark RDD编程基础相关的知识,希望对你有一定的参考价值。

准备文本文件

 从文件创建RDD lines=sc.textFile()
 筛选出含某个单词的行 lines.filter()
 lambda 参数:条件表达式

 

 

 生成单词的列表

  从列表创建RDD words=sc.parallelize()
 筛选出长度大于10 的单词 words.filter()

以上是关于03Spark RDD编程基础的主要内容,如果未能解决你的问题,请参考以下文章

spark 深入学习 05RDD编程之旅基础篇02-Spaek shell

Spark基础编程学习01

:RDD 编程入门

Spark 编程基础

学习笔记Spark—— Spark编程基础(创建RDDRDD算子文件读取与存储)

spark浅谈:SPARK核心编程