HBase启用压缩

Posted concurrencyy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HBase启用压缩相关的知识,希望对你有一定的参考价值。

1. 压缩算法的比较

算法 压缩比 压缩 解压
GZIP 13.4% 21MB/s 118MB/s
LZO 20.5% 135MB/s 410MB/s
Snappy/Zippy 22.2% 172MB/s 409MB/s

总结:

1)GZIP的压缩率最高,但它是CPU密集型的,对CPU的消耗较多,压缩和解压速度也慢;

2)LZO的压缩率居中,比GZIP要低一些,但是压缩和解压速度明显要比GZIP快很多,其中解压速度快的更多;

3)Zippy/Snappy的压缩率最低,而压缩和解压速度要稍微比LZO要快一些

所以,一般情况下,推荐使用Snappy和Zippy压缩算法。

2. hbase表启用压缩的步骤

这里分为两种情况:一是在创建表时指定压缩算法;二是在创建表后指定压缩算法或者修改压缩算法。

2.1 创建表时指定压缩算法

create ‘test‘, {NAME => ‘info‘, VERSIONS => 1, COMPRESSION => ‘snappy‘}
# 表创建之后,使用describe命令查看表信息
describe ‘test‘

2.2 创建表后指定或修改压缩算法

1) disable需要修改的表

disable ‘test‘

注意,如果表较大,disable需要一些时间,请耐心等待
2) 使用alter命令进行更改

alter ‘test‘, NAME => ‘info‘, COMPRESSION => ‘snappy‘

NAME即column family,列族。HBase修改压缩格式,需要一个列族一个列族的修改,注意大小写,不要弄错了。如果修改错了,将会创建一个新的列族,且压缩格式为snappy。当然,假如你还是不小心创建了一个新列族的话,可以通过以下方式删除:

alter ‘test‘, {NAME=>‘info‘, METHOD=>‘delete‘}

3) 重新enable表

enable ‘test‘

4) 对表进行major_compact操作,使压缩生效

major_compact  ‘test‘

注意,如果表的数据较多,该操作需要较长时间,所以尽量选择一个不忙的时间,避免对服务造成影响。

修改完成后,可使用describe命令查看表信息












以上是关于HBase启用压缩的主要内容,如果未能解决你的问题,请参考以下文章

HBASE优化项AND每日健康

在 webview_flutter 中启用捏合和缩放,在哪里添加代码片段 [this.webView.getSettings().setBuiltInZoomControls(true);]

HBase写入性能改造(续)--MemStoreflushcompact参数调优及压缩卡的使用

hbase的四种压缩格式

HBase 安装snappy压缩软件以及相关编码配置

走进大数据 | 教你玩转 HBase开启Snappy压缩