mapreduce压缩

Posted 瓶子xf

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mapreduce压缩相关的知识,希望对你有一定的参考价值。

这是mr的一种优化策略,通过压缩编码对mapper或者reducer的输出进行压缩,以减少磁盘io,提高mr运行速度(但也相应增加了cpu运算负担)

特性:

1.mr支持将map输出的结果或者reduce输出的结果进行压缩,以减少网络IO或最终输出数据的体积。

2.压缩特性使用得当能提高性能,但运用不当也可降低性能。

3.基本原则:

运算密集型的job,少用压缩

io密集型的job,多用压缩

 

也可以设置map端的输出压缩。

以上是关于mapreduce压缩的主要内容,如果未能解决你的问题,请参考以下文章

大数据技术之Hadoop(MapReduce)框架原理数据压缩

大数据技术之Hadoop(MapReduce)框架原理数据压缩

MapReduce-实践2

大数据之Hadoop(MapReduce):压缩实操案例

hadoop mapreduce开发实践之输出数据压缩

MapReduce Join案例ETL压缩简介