CDH--HDFS和Yarn存储不足

Posted 北京小辉

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了CDH--HDFS和Yarn存储不足相关的知识,希望对你有一定的参考价值。

备注:
最近公司CDH集群中的某个DataNode存储一直报警,分析如下:
1)一个集群有多个DataNode
2)一个DataNode的数据会存储在多个路径。eg: /data1,/data2,/data3等等
3)/data3 路径下面除了【/data3/dfs/dn】和 【/data3/yarn/nm】路径还会有其余文件,导致路径文件过大,同时CDH的 balancer 的平衡机制无法平衡
4)解决方法:清除路径多余文件,或者在CDH中的DataNode移除对应路径
5)无论DataNode还是yarn,都会有一个【默认组】还有一个【独立组】。如果没有对单独机器指定路径,那相同角色路径配置一样。如果修改单独服务器路径需要重启角色。
截图如下:

以上是关于CDH--HDFS和Yarn存储不足的主要内容,如果未能解决你的问题,请参考以下文章

YARN的优点以及不足

Flink on Yarn 提交任务由于内存不足产生的异常调试

yarn.lock文件

spark执行在yarn上executor内存不足异常ERROR YarnScheduler: Lost executor 542 on host-bigdata3: Container marked

YARN入门

yarn.lock文件