hadoop balancer(重新平衡)

Posted 格格巫 MMQ!!

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hadoop balancer(重新平衡)相关的知识,希望对你有一定的参考价值。

1.快速入门
当前存储集群的DN的空间占用率很不均衡,最大的使用率接近100%,最小的使用率不到35%。
为了平衡空间的占用率,我们在CDH上开启了“重新平衡”。

调用的脚本实际如下:
hdfs/hdfs.sh [“balancer”,"-threshold",“10.0”,"-policy","DataNode”]
查看当前的进度条:
Successfully moved blk_1255414776_181709174 with size=134217728 from 172.16.16.66:50010:DISK to 172.16.16.39:50010:DISK through 172.16.16.219:50010
重新平衡并没有将空间占用率最高的DN优先执行。
回到顶部
2.命令行优化办法
查看hdfs balancer的命令如下:
[root@R720ip39 ~]# hdfs balancer -help
Usage: java Balancer
[-policy ] the balancing policy: datanode or blockpool
[-threshold ] Percentage of disk capacity
[-exclude [-f | comma-sperated list of hosts]] Excludes the specified datanodes.
[-include [-f | comma-sperated list of hosts]] Includes only the specified datanodes.
为了更高效率的执行balancer操作,建议如下:
-threshold 30 设置越大,越快结束,并且优先解决DN占用率高的
参数含义:判断集群

以上是关于hadoop balancer(重新平衡)的主要内容,如果未能解决你的问题,请参考以下文章

转载漫谈HADOOP HDFS BALANCER

转HADOOP HDFS BALANCER介绍及经验总结

hadoop balance工具平衡集群dfs存储及遇到异常Got error, status message Not able to receive block 1073959989 from /1

平衡器在 hdfs HA 中不起作用

HDFS Balancer负载均衡器

按表重新平衡 hbase 区域