在集群上运行Spark应用的详细过程

Posted reedom1991

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在集群上运行Spark应用的详细过程相关的知识,希望对你有一定的参考价值。

在集群上运行Spark应用的详细过程:

(1)用户通过spark-submit脚本提交应用

(2)spark-submit脚本启动驱动器程序,调用用户定义的main()方法

(3)驱动器程序与集群管理器通信,申请资源以启动执行器节点

(4)集群管理器为驱动器程序启动执行器节点

(5)驱动器进程执行用户应用中的操作。根据程序中所定义的对RDD的转换操作和行动操作,驱动器节点把动作以任务的形式发送到执行器进程

(6)任务在执行器程序中进行计算并保存结果

(7)如果驱动器程序的main()方法退出,或者调用了SparkContext.stop(),驱动器程序会终止执行器进程,并且通过集群管理器释放资源

以上是关于在集群上运行Spark应用的详细过程的主要内容,如果未能解决你的问题,请参考以下文章

spark记录Spark运行流程及在不同集群中的运行过程

如何将应用程序打包到能够在 Kubernetes 中的 Spark 集群上运行的 docker 镜像中?

如何在 Spark 集群上运行 Spring Boot 应用程序

eclipse编写scala应用运行在spark集群上

在spark集群上可以同时运行多个提交的应用程序吗

Spark集群管理器介绍