spark on yarn的提交过程

Posted 上官沐雪

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark on yarn的提交过程相关的知识,希望对你有一定的参考价值。

spark on yarn集群的提交过程

  1. 当程序提交时会启动sparkSubmit进程,里面会有解析参数对象(sparkSubmitArguments)和连接yarn的对象(yarnClusterApplication、yarnClient),连接yarn的对象连接resourceManager,请求启动ApplicationMaster
  2. resourceManager启动ApplicationMaster
  3. ApplicationMaster启动driver并且初始化sparkContext
  4. ApplicationMaster反向注册resourceManager请求资源
  5. resourceManager返回可用的资源列表
  6. ApplicationMaster启动Executor执行后台 yarnCoarseGrainedExecutorBackend(用于和yarn进行通信,启动Executor)
  7. yarnCoarseGrainedExecutorBackend向Driver反向注册
  8. Driver返回注册成功
  9. yarnCoarseGrainedExecutorBackend启动Executor

如下图:

以上是关于spark on yarn的提交过程的主要内容,如果未能解决你的问题,请参考以下文章

Spark on Yarn模式提交任务后,会进行以下几个过程

Spark on yarn遇到的问题

Spark on Yarn提交配置没有生效

记2018最后一次问题诊断-Spark on Yarn所有任务运行失败

Spark on Yarn:任务提交参数配置

spark on yarn任务提交缓慢解决