修正版|Spark任务提交后都干了些什么?

Posted DLab数据实验室

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了修正版|Spark任务提交后都干了些什么?相关的知识,希望对你有一定的参考价值。

导读:猛然发现昨天文章中的内容不全,重新补发。

来源:DLab数据实验室(ID:rucdlab)




Spark提交后都干了些什么?

下图就是Spark通过client提交后,详细的运行情况(注:部署模式为yarn-cluster模式)。如果不太了解部署模式,可以看一下上一篇文章


修正版|Spark任务提交后都干了些什么?

spark任务提交后,主要分为三个阶段,下面来详细说明。

总结

通过这篇文章,我们应该又多了一个spark任务运行调试小技巧,就是可以去相应的hdfs目录来查看该目录下的资源、配置以及依赖包是否齐全,然后进一步分析程序运行的一些异常。

例如下面这样,我们可以发现这个application没有提交第三方jar包,只是提交了spark的配置文件。

以上是关于修正版|Spark任务提交后都干了些什么?的主要内容,如果未能解决你的问题,请参考以下文章

《哲学家们都干了些什么》——林欣浩

哲学家们都干了些什么?

天呐!你知道MSBuild都干了些什么

编译器优化代码都干了些什么不为人知的事情?

看看C# 6.0中那些语法糖都干了些什么(上篇)

程序媛字节裸辞后,都干了些什么....