RDD转换操作算子 --- 集合操作(unionintersectionsubtract)
Posted 阿呆小记
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了RDD转换操作算子 --- 集合操作(unionintersectionsubtract)相关的知识,希望对你有一定的参考价值。
/*
* union 表示并集,与数学概念里的不同处在于,它可以重复,也就是两个集合的所有元素
*/
@Test
def unionTest: Unit =
val rdd1 = sc.parallelize(Seq(1,2,3,4,5))
val rdd2 = sc.parallelize(Seq(3,4,5,6,7))
rdd1.union(rdd2)
.collect()
.foreach(println(_)) // 1 2 3 4 5 3 4 5 6 7
/*
* intersection 表示交集
*/
@Test
def intersectionTest: Unit =
val rdd1 = sc.parallelize(Seq(1,2,3,4,5))
val rdd2 = sc.parallelize(Seq(3,4,5,6,7))
rdd1.intersection(rdd2)
.collect()
.foreach(println(_)) // 3 4 5
/*
* subtract 表示差集, a 差 b --- a中独有的元素 ;b 差 a --- b 中独有的元素
*/
@Test
def subtractTest: Unit =
val rdd1 = sc.parallelize(Seq(1,2,3,4,5))
val rdd2 = sc.parallelize(Seq(3,4,5,6,7))
rdd1.subtract(rdd2)
.collect()
.foreach(println(_)) // 1 2
以上是关于RDD转换操作算子 --- 集合操作(unionintersectionsubtract)的主要内容,如果未能解决你的问题,请参考以下文章