Hive数据压缩

Posted chensm

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive数据压缩相关的知识,希望对你有一定的参考价值。

****几个配置方式:
>>>MR程序
>>>mapred-site.xml
>>>hive命令行


1.Map端数据输出压缩
set hive.exec.compress.intermediate = true;
set mapreduce.map.output.compress = true;
set mapreduce.map.output.compress.codec = org.apache.hadoop.io.compress.SnappyCodec;


2.Reduce端数据输出压缩

set hive.exec.compress.output = true;
set mapreduce.output.fileoutputformat.compress = true;
set mapreduce.output.fileoutputformat.compress.codec = org.apache.hadoop.io.compress.SnappyCodec;

 

然后在hive 执行sql语句即可,

技术分享图片

可以在yarn的日志页面看到该job的运行参数,明显已经发生了变化:

技术分享图片











以上是关于Hive数据压缩的主要内容,如果未能解决你的问题,请参考以下文章

Hive文件存储格式和hive数据压缩

如何在Hive中进行数据压缩以实现高效存储?

hive数据压缩技术001

Hive 压缩数据,按数据聚类,按数据排序

在同一个 Hive 表上进行多次压缩

Hive数据压缩