03Spark RDD编程基础
Posted 123wen
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了03Spark RDD编程基础相关的知识,希望对你有一定的参考价值。
准备文本文件
从文件创建RDD lines=sc.textFile()
筛选出含某个单词的行 lines.filter()
lambda 参数:条件表达式
生成单词的列表
从列表创建RDD words=sc.parallelize()
筛选出长度大于10 的单词 words.filter()
以上是关于03Spark RDD编程基础的主要内容,如果未能解决你的问题,请参考以下文章
spark 深入学习 05RDD编程之旅基础篇02-Spaek shell