Yarn使用cgroups隔离CPU资源实战

Posted 2021-05-01 祝威廉

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Yarn使用cgroups隔离CPU资源实战相关的知识，希望对你有一定的参考价值。

yarn默认只管理内存资源,虽然也可以申请cpu资源,但是在没有cpu资源隔离的情况下效果并不是太好.在集群规模大,任务多时资源竞争的问题尤为严重.

还好yarn提供的LinuxContainerExecutor可以通过cgroup来隔离cpu资源

微信排版一直很蛋疼，我虽然全部代码配置转化为图片，但是也可能有遗漏。大家如果想跟着步骤做，建议访问原文链接。

cgroup

cgroup是系统提供的资源隔离功能,可以隔离系统的多种类型的资源,yarn只用来隔离cpu资源

安装cgroup

默认系统已经安装了cgroup了,如果没有安装可以通过命令安装

然后通过命令启动

Yarn使用cgroups隔离CPU资源实战

查看/cgroup目录,可以看到里面已经创建了一些目录,这些目录就是可以隔离的资源

Yarn使用cgroups隔离CPU资源实战

如果目录没有创建可以执行

Yarn使用cgroups隔离CPU资源实战

通过cgroup隔离cpu资源的步骤为

在cpu目录创建分组
cgroup以组为单位隔离资源,同一个组可以使用的资源相同
一个组在cgroup里面体现为一个文件夹,创建分组直接使用mkdir命令即可.
组下面还可以创建下级组.最终可以形成一个树形结构来完成复杂的资源隔离方案.
每当创建了一个组,系统会自动在目录立即创建一些文件,资源控制主要就是通过配置这些文件来完成

Yarn使用cgroups隔离CPU资源实战

yarn默认使用hadoop-yarn组作为最上层,任务运行时yarn会为每个container在hadoop-yarn里面创建一个组
yarn主要使用cpu.cfs_quota_us cpu.cfs_period_us cpu.shares3个文件
yarn使用cgroup的两种方式来控制cpu资源分配

严格按核数隔离资源
可使用核数 = cpu.cfs_quota_us/cpu.cfs_period_us
在yarn中cpu.cfs_quota_us被直接设置为1000000(这个参数可以设置的最大值)
然后根据任务申请的core来计算出cpu.cfs_period_us
按比例隔离资源
按每个分组里面cpu.shares的比率来分配cpu
比如A B C三个分组,cpu.shares分别设置为1024 1024 2048,那么他们可以使用的cpu比率为1:1:2

将进程id添加到指定组的tasks文件
创建完分组后只需要将要限制的进程的id写入tasks文件即可,如果需要解除限制,在tasks文件删除即可

yarn配置

启动cgroup需要配置几个配置文件

etc/hadoop/yarn-site.xml配置

可以参考配置
这些配置大部分都是固定配置

Yarn使用cgroups隔离CPU资源实战

etc/hadoop/container-executor.cfg配置

这个配置文件每项都需要填,要不然会报错

Yarn使用cgroups隔离CPU资源实战

权限设置

在配置中文件的权限有特殊要求

Yarn使用cgroups隔离CPU资源实战

系统还要求etc/hadoop/container-executor.cfg 的所有父目录(一直到/ 目录) owner 都为 root
这个路径是默认${HADOOP_HOME}/etc/hadoop/container-executor.cfg,如果不方便修改所有父级目录为root权限,可以重新编译代码到其他目录,比如/etc/hadoop/目录

Yarn使用cgroups隔离CPU资源实战