Spark之Yarn提交模式

Posted yszd

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark之Yarn提交模式相关的知识,希望对你有一定的参考价值。

一.Client模式

  提交命令:

  ./spark-submit --master yarn --class org.apache.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.7.3.jar 1000

  ./spark-submit --master yarn-client --class org.apache.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.7.3.jar 1000

  ./spark-submit --master yarn --deploy-mode client --class org.apache.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.7.3.jar 1000

  架构:  

  技术图片

二.Cluster模式

  提交命令:

  ./spark-submit --master yarn --deploy-mode cluster --class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.7.3.jar 1000

  ./spark-submit --master yarn-cluster --class org.apache.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.7.3.jar 1000

  架构:

   技术图片

三.区别

  client模式会在客户端创建Driver,当任务过多时会导致网络IO激增问题,而cluster会在集群的各个节点创建Driver,均摊了网络IO,不易发生网络瓶颈。

 

以上是关于Spark之Yarn提交模式的主要内容,如果未能解决你的问题,请参考以下文章

大数据技术之Spark ——Spark运行模式(local+standalone+yarn)

Spark篇---Spark中yarn模式两种提交任务方式

spark远程debug之调试spark on yarn 程序

几种常见的spark任务提交模式

spark任务的提交流程(yarn)

2. spark-2.4.6源码分析(基于yarn cluster模式)-YARN client启动,提交ApplicationMaster