统计hive库表在具体下所有分区大小

Posted chengjianxiaoxue

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了统计hive库表在具体下所有分区大小相关的知识,希望对你有一定的参考价值。

 

 

1 查询具体表分区大小,以字节展示

hadoop fs -du  /user/hive/warehouse/treasury.db/dm_user_excercise  > dm_user_excercise.txt

 

2 定义shell脚本:

#!/bin/bash
#

size18=0
size17=0
size16=0


filename=$1
echo $filename


while read line
do


num=` echo $line | cut -d " " -f 1`
#echo $num



if  [[ $line =~ "2018-" ]] ; then
   let size18=$size18+$num
elif [[ $line =~ "2017-" ]] ; then   
   let size17=$size17+$num
elif [[ $line =~ "2016-" ]] ; then   
   let size16=$size16+$num
else
   echo "2018 2017 2016年之外的分区" 
   echo $line    
fi

done < $filename                   

let size18=$size18/1024/1024/1024
let size17=$size17/1024/1024/1024
let size16=$size16/1024/1024/1024

echo "2018分区表大小G: "$size18
echo "2017分区表大小G: "$size17
echo "2016分区表大小G: "$size16

 

3 调用命令:

sh filter5.sh  dm_user_excercise.txt 

以上是关于统计hive库表在具体下所有分区大小的主要内容,如果未能解决你的问题,请参考以下文章

分区的ORC表在Hive中显示为空

hive的严格模式和分区

hive表在写入过程中可以读取吗

hive中创建外部分区表使用location是指定数据存放位置还是指数据来源

Hive 分区表的记录数

hive 中的拉链表 1