大数据之Hadoop(MapReduce)：Yarn运行机制

Posted 2021-06-26 浊酒南街

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了大数据之Hadoop(MapReduce)：Yarn运行机制相关的知识，希望对你有一定的参考价值。

1.Yarn运行机制

在这里插入图片描述

2.工作机制详解

（1）MR程序提交到客户端所在的节点。
（2）YarnRunner向ResourceManager申请一个Application。
（3）RM将该应用程序的资源路径返回给YarnRunner。
（4）该程序将运行所需资源提交到HDFS上。
（5）程序资源提交完毕后，申请运行mrAppMaster。
（6）RM将用户的请求初始化成一个Task。
（7）其中一个NodeManager领取到Task任务。
（8）该NodeManager创建容器Container，并产生MRAppmaster。
（9）Container从HDFS上拷贝资源到本地。
（10）MRAppmaster向RM 申请运行MapTask资源。
（11）RM将运行MapTask任务分配给另外两个NodeManager，另两个NodeManager分别领取任务并创建容器。
（12）MR向两个接收到任务的NodeManager发送程序启动脚本，这两个NodeManager分别启动MapTask， MapTask对数据分区排序。
（13）MrAppMaster等待所有MapTask运行完毕后，向RM申请容器，运行ReduceTask。
（14）ReduceTask向MapTask获取相应分区的数据。
（15）程序运行完毕后，MR会向RM申请注销自己。

以上是关于大数据之Hadoop(MapReduce)：Yarn运行机制的主要内容，如果未能解决你的问题，请参考以下文章

hadoop(二MapReduce)

大数据之Hadoop(MapReduce): MapReduce概述

大数据之Hadoop(MapReduce):MapReduce核心思想

大数据之Hadoop(MapReduce)：Hadoop企业优化

大数据技术之Hadoop（MapReduce）概述序列化

大数据之Hadoop(MapReduce)：Yarn运行机制

目录

1.Yarn运行机制

2.工作机制详解