Spark 算子 reduce / reduceByKey / reduceByKeyLocally 区别
Posted MISAYAONE
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark 算子 reduce / reduceByKey / reduceByKeyLocally 区别相关的知识,希望对你有一定的参考价值。
https://www.pianshen.com/article/3338706075/
https://www.pianshen.com/article/3338706075/
reduce 返回一个 Python 对象,它是对 RDD 中的每两个元素进行操作,并递归的用结果替代这两个元素。
reduceByKey 返回一个 RDD 对象,它将同 key 的元素进行聚合
reduceByKeyLocally 返回一个 dict 对象,同样是将同 key 的元素进行聚合
以上是关于Spark 算子 reduce / reduceByKey / reduceByKeyLocally 区别的主要内容,如果未能解决你的问题,请参考以下文章