Spark 术语与宽窄依赖

Posted manba_yqq

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark 术语与宽窄依赖相关的知识,希望对你有一定的参考价值。

  1. 术语解释
  2. 窄依赖和宽依赖
    RDD 之间有一系列的依赖关系,依赖关系又分为窄依赖和宽依赖。
    1 .窄依赖:父 RDD 和子 RDD partition 之间的关系是一对一的。或者父 RDD 一个 partition 只 对应一个子 RDD 的 partition 情况下的父 RDD 和子 RDD partition 关系是多对一的。不 会有 shuffle 的产生。
    2 .宽依赖:父 RDD 与子 RDD partition 之间的关系是一对多。会有 shuffle 的产生。 宽窄依赖图理解:

以上是关于Spark 术语与宽窄依赖的主要内容,如果未能解决你的问题,请参考以下文章

Spark RDD 宽窄依赖

Spark---宽窄依赖

spark-DAG,宽窄依赖,Stage,Shuffle

Spark RDD基本概念宽窄依赖转换行为操作

spark stage

Spark面试题