Hadoop Yarn工作机制 Job提交流程

Posted IT备忘录

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop Yarn工作机制 Job提交流程相关的知识,希望对你有一定的参考价值。

(1)MR程序提交到客户端所在的节点。
(2)YarnRunner向ResourceManager申请一个Application。
(3)RM将该应用程序的资源路径返回给YarnRunner。
(4)该程序将运行所需资源提交到HDFS上。
(5)程序资源提交完毕后,申请运行mrAppMaster。
(6)RM将用户的请求初始化成一个Task。(放入调度器)
(7)其中一个NodeManager领取到Task任务。
(8)该NodeManager创建容器Container,并产生MRAppmaster。
(9)Container从HDFS上拷贝资源到本地。
(10)MRAppmaster向RM 申请运行MapTask资源。
(11)RM将运行MapTask任务分配给另外两个NodeManager,另两个NodeManager分别领取任务并创建容器。
(12)MR向两个接收到任务的NodeManager发送程序启动脚本,这两个NodeManager分别启动MapTask,MapTask对数据分区排序。
(13)MrAppMaster等待所有MapTask运行完毕后,向RM申请容器,运行ReduceTask。
(14)ReduceTask向MapTask获取相应分区的数据。
(15)程序运行完毕后,MR会向RM申请注销自己。

以上是关于Hadoop Yarn工作机制 Job提交流程的主要内容,如果未能解决你的问题,请参考以下文章

hadoop MapReduce Yarn运行机制

Yarn的基础介绍以及job的提交流程

yarn三种调度器(资源调度策略或机制)

MapReduce与Yarn 的详细工作流程分析

hadoophadoop的Job 提交流程切片源码

3 weekend110的job提交的逻辑及YARN框架的技术机制 + MR程序的几种提交运行模式