RDD转换操作算子 --- 集合操作(unionintersectionsubtract)

Posted 阿呆小记

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了RDD转换操作算子 --- 集合操作(unionintersectionsubtract)相关的知识,希望对你有一定的参考价值。


/*
* union 表示并集,与数学概念里的不同处在于,它可以重复,也就是两个集合的所有元素
*/
@Test
def unionTest: Unit =
val rdd1 = sc.parallelize(Seq(1,2,3,4,5))
val rdd2 = sc.parallelize(Seq(3,4,5,6,7))

rdd1.union(rdd2)
.collect()
.foreach(println(_)) // 1 2 3 4 5 3 4 5 6 7


/*
* intersection 表示交集
*/
@Test
def intersectionTest: Unit =
val rdd1 = sc.parallelize(Seq(1,2,3,4,5))
val rdd2 = sc.parallelize(Seq(3,4,5,6,7))

rdd1.intersection(rdd2)
.collect()
.foreach(println(_)) // 3 4 5


/*
* subtract 表示差集, a 差 b --- a中独有的元素 ;b 差 a --- b 中独有的元素
*/
@Test
def subtractTest: Unit =
val rdd1 = sc.parallelize(Seq(1,2,3,4,5))
val rdd2 = sc.parallelize(Seq(3,4,5,6,7))

rdd1.subtract(rdd2)
.collect()
.foreach(println(_)) // 1 2


以上是关于RDD转换操作算子 --- 集合操作(unionintersectionsubtract)的主要内容,如果未能解决你的问题,请参考以下文章

RDD转换算子与操作算子

Spark算子

Spark算子:RDD基本转换操作–mapflatMapdistinct

Spark RDD基本概念宽窄依赖转换行为操作

Spark——RDD算子

spark day02+day03