RDD转化操作记录(持续更新)

Posted 1061321925wu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了RDD转化操作记录(持续更新)相关的知识,希望对你有一定的参考价值。

1、map(function)

map是对RDD中的每个元素都执行一个指定的函数来产生一个新的RDD。任何原RDD中的元素在新RDD中都有且只有一个元素与之对应。

val a = sc.parallelize(1 to 9, 3)
val b = a.map(x => x*2)//x => x*2是一个函数,x是传入参数即RDD的每个元素,x*2是返回值
a.collect
//结果Array[Int] = Array(1, 2, 3, 4, 5, 6, 7, 8, 9)
b.collect
//结果Array[Int] = Array(2, 4, 6, 8, 10, 12, 14, 16, 18)

 也可以把key变成Key-Value键值对

val a = sc.parallelize(List("dog", "tiger", "lion", "cat", "panther", " eagle"), 2)
val b = a.map(x => (x, 1))
b.collect.foreach(println(_))
/*
(dog,1)
(tiger,1)
(lion,1)
(cat,1)
(panther,1)
( eagle,1)
*/

2、

技术图片

 

 

 技术图片

 

暂时写这些,参考博文:https://blog.csdn.net/weixin_34418883/article/details/85874446

 https://blog.csdn.net/a414129902/article/details/84770548

 

以上是关于RDD转化操作记录(持续更新)的主要内容,如果未能解决你的问题,请参考以下文章

RDD基础

回归 | js实用代码片段的封装与总结(持续更新中...)

小程序各种功能代码片段整理---持续更新

RDD编程下(自学四)

Spark——RDD算子

RDD(google rdd paper notes)