Spark 算子 reduce / reduceByKey / reduceByKeyLocally 区别

Posted MISAYAONE

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark 算子 reduce / reduceByKey / reduceByKeyLocally 区别相关的知识,希望对你有一定的参考价值。

https://www.pianshen.com/article/3338706075/

https://www.pianshen.com/article/3338706075/

reduce 返回一个 Python 对象,它是对 RDD 中的每两个元素进行操作,并递归的用结果替代这两个元素。

reduceByKey 返回一个 RDD 对象,它将同 key 的元素进行聚合

reduceByKeyLocally 返回一个 dict 对象,同样是将同 key 的元素进行聚合

以上是关于Spark 算子 reduce / reduceByKey / reduceByKeyLocally 区别的主要内容,如果未能解决你的问题,请参考以下文章

Spark算子

Spark-Core RDD行动算子

Spark算子篇 --Spark算子之combineByKey详解

Spark 算子

Spark RDD-行动算子

Spark Troubleshooting