检查hdfs文件块占用情况

Posted liwutao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了检查hdfs文件块占用情况相关的知识,希望对你有一定的参考价值。

 

批量执行检查脚本:

#!/bin/bash
file_name="$1"
if [ -z "$file_name" ];then
	echo "Pls input file path"
	exit 1
fi

cat "$file_name"| while read line
do
	hadoop fsck $line -blocks > temp.log
	echo $line >> final.log
	tail -11 temp.log >> final.log
	echo "">temp.log
	echo "Finish check $line"
done

  

传入参数为文件名,将该文件和脚本放在同一目录下,该文件中每行记录一个hdfs中的文件全路径

如: /user/test/liwt/sic/studentTable

获取hdfs中文件列表的方式很多,在此不做赘述。

 

以上是关于检查hdfs文件块占用情况的主要内容,如果未能解决你的问题,请参考以下文章

hadoop namenode

HDFS概述————Block块大小设置

HDFS中的fsck命令(检查数据块是否健康)

hadoop 之hdfs数据块修复方法

HDFS存在大量小文件问题的解决方案

HDFS架构