YARN原理介绍

Posted 2020-08-12

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了YARN原理介绍相关的知识，希望对你有一定的参考价值。

文章包含内容：

1. YARN产生背景

2. YARN基本架构及原理

-----------------------------------------------------------

1. YARN产生背景

Hadoop1.x中的MapReduce构成图

技术分享

　　在Hadoop1.0中，MapReduce主要是由JobTracker和TaskTracker构成。MapReduce采用了Master/Slave架构，表现形式为一个JobTracker带多个TaskTracker，作为Master的JobTracker，它是整个集群的唯一的全局管理者，它也是一个服务进程，启动之后，它会一直监听并接收来自各个TaskTracker发送的“心跳”信息，资源使用情况和任务运行情况。

　　JobTracker主要有两大功能：首先是作业布置，在Hadoop中，每个应用程序被表示为一个作业，每个作业又被分成多个任务，JobTracker的作业控制模块负责作业的分解和状态的监控。监控是对TaskTracker的状态进行监控，作业状态、任务状态进行监控，其作用是容错和对任务调度提供依据。第二个JobTracker的主要功能是资源管理，JobTracker在Hadoop1中身兼多职，这也为它后面，包括它的扩展性和单点故障埋下了隐患。

　　作为Slave的TaskTracker有两个作用：第一个是汇报心跳，TaskTracker会周期性的将所有节点上各种信息通过心跳机制汇报给JobTracker，包括节点的健康状况、资源使用情况、任务执行进度、任务进行状态等。第二个是执行命令，执行JobTracker给TaskTracker下达的各种命令，包括启动任务、提交任务、杀死任务、杀死作业和重新初始化。

Hadoop1.x中MapReduce弊端

　　扩展性差、可靠性差、资源利用率低、无法支持多种计算框架

扩展性差

　　JobTracker兼备了资源管理和作业控制两大功能，这成为系统的一个最大瓶颈，它严重制约了Hadoop集群的扩展性。后面为解决这个问题，设置了YARN，YARN只负责资源管理。

可靠性差

　　因为Hadoop1种MapReduce采用Master/slave结构，因此作为Master的JobTracker一旦发生单点故障，将导致整个集群不可用。

资源利用率低

　　Hadoop1的MapReduce采用了一种基于槽位（slot）的资源分配模式，槽位是一种粗粒度的资源划分单位，通常一个任务不会用完槽位的固定资源，且其他任务也无法使用这些空闲资源。我们通常将槽位分为map slot和reduce slot两种，且不允许它们之间共享，常常会导致一种槽位资源紧张，而另一种槽位资源空闲，这会大大浪费资源。后面也会讲到YARN的资源分配的单位container。

无法支持多种计算框架

　　MapReduce是一种基于磁盘的离线计算，现在大数据不仅仅包括这种离线计算，还包括内存计算、流式计算、迭代式计算，而hadoop1和MapReduce无法支持多种计算框架。在一个平台上集成多种计算框架的优点是：1.资源利用率高，如果每个框架一个集群，则往往因为应用程序的数量和资源利用率的不均衡，使得在某段时间内，某些框架内的资源紧张，而另外一些资源空闲。共享集群模式则通过多种框架共享资源，使集群中的资源可以充分地利用。2.运维成本低。3.数据共享由于数据量的暴增，跨集群间的数据移动不仅花费时间长，且运维成本也会大大增加，共享集群可以让多种框架共享数据和硬件资源，这可以减少数据移动带来的成本。

基于上述缺点，Hadoop2提供了一个资源管理器YARN。

2. YARN基本架构及原理

　　YARN是一种Hadoop资源管理器，它是一个通用资源管理系统，可为上层应用提供统一的资源管理和调度，它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。YARN主要是由ResourceManager，NodeManager和application master和相应的container构成的。

YARN的主要组件

　　ResourceManager

　　ApplicaitonMaster

　　NodeManager

　　Container

YARN的结构图

　　Resource Manager主要负责这些Node Manager资源统一的管理和调度，当用户提交一个应用程序，需要提交一个用于跟踪管理这个应用程序的Application Master，在Node Manager上Container上产生的一个Application Master，Application Master主要负责向Resource Manager申请资源，并要求NodeManager启动可以占用一定资源任务，Application Master向Resource Manager不断地以轮询的方式索要资源，要到资源以后，它会要求Node Manager在相应的资源上启动它的任务。

　　Resource Manager是什么？

　　Resource Manager是一个全局资源管理器，它负责整个系统的资源管理分配，主要由两个组件构成：一个是调度器，一个是应用程序管理器，Resource Scheduler和Application Manager。

　　Resource Manager的调度器是一个纯的调度器，它不从事任何与应用程序相关的工作，它将系统中的资源分配给各个正在运行中的程序，它不负责监控或者跟踪应用的执行状态，也不负责重新启动因应用程序失败或者硬件故障而产生的失败任务。这些都由应用程序对应的Application Master完成。调度器是一个可插拔的组件，用户可以根据自己的需要设计新的调度器，YARN提供了很多直接可用的调度器。

　　应用程序管理器，它负责整个系统中所有应用程序，包括应用程序提交，与调度器协商资源已启动Application Master，监控Application Master运行状态，并在失败的时候通知它。而具体的任务，则交给Application Master去管理，相当于一个项目经理。用户提交的每一个应用程序都包含一个Application Master，Application Master主要是与Resource Manager协调协商获取资源Application Master将得到的作业分配内部的这些任务Application Master负责与Node Manager通信以启动停止任务，并监控该应用程序所在，所有任务运行状态，当任务运行失败时，重新为任务申请资源并重启任务。

　　Node Manager作为YARN的一个slave，它是整个运行的一个执行者，Node Manager是每个节点上资源和任务管理器，它会定时向Resource Manager汇报本节点的资源使用情况和各个Container（这是一个动态的资源单位）的运行状态，并且Node Manager接收并处理来自Application Master的Container启动和停止等请求。Container资源抽象，它是封装了某个节点的多维度资源，比如封装了内存、CPU、磁盘、网络，当Application Master向Resource Manager申请资源时，Resource Manager为Application Master返回的资源是一个Container，得到资源的任务只能使用该Application Master，Container是根据应用程序需求动态生成的。

流程图

工作原理

　　首先，Client向YARN中提交一个应用程序，包括Application Master，启动Application Master和用户程序；

　　然后，ResourceManager会为该应用程序分配一个Container，它首先会跟Node Manager进行通信，要求它在这个Container中启动应用程序的Application Master；

　　第三步，Application Master一旦生成以后，它首先会向ResourceManager注册，这样用户可以直接通过ResourceManager查看应用程序的运行状态，然后它将为各个任务申请资源并监控它们的运行状态，直到运行结束，它会以轮询的方式，通过RPC协议向ResouceManager申请和领取资源，一旦Application Master申请到资源后，它会和Node Manager通信，要求它启动任务；

　　Node Manager为任务设置好运行环境，以及环境变量、架包还有二进制程序，将任务启动命令写在脚本中，并通过运行该脚本启动任务，各个任务通过RPC协议向Application Master汇报自己的状态和进度，这样会让Application Master随时掌握各个任务的一个运行状态，一旦任务失败，Application Master就会重启该任务，重新申请资源。应用程序运行完成后，Application Master就会向ResourceManager注销并关闭此任务。我们在应用程序整个运行过程中可以用RPC向Application Master查询应用程序当前的运行状态，在Web上可以看到整个的作业的运行状态。

以上是关于YARN原理介绍的主要内容，如果未能解决你的问题，请参考以下文章

简单介绍 HDFS，MapReduce，Yarn 的架构思想和原理

解析HetuEngine实现On Yarn原理

Yarn 详解

Yarn_原理

hadoop yarn