Hbase常用shell操作
Posted 赵广陆
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hbase常用shell操作相关的知识,希望对你有一定的参考价值。
1 需求
我们可以以shell的方式来维护和管理HBase。例如:执行建表语句、执行增删改查操作等等。
有以下订单数据,我们想要将这样的一些数据保存到HBase中。
接下来,我们将使用HBase shell来进行以下操作:
- 创建表
- 添加数据
- 更新数据
- 删除数据
- 查询数据
2 创建表
在HBase中,所有的数据也都是保存在表中的。要将订单数据保存到HBase中,首先需要将表创建
出来。
2.1 启动HBase Shell
HBase的shell其实JRuby的IRB(交互式的Ruby),但在其中添加了一些HBase的命令。
启动HBase shell:
hbase shell
2.2 创建表
语法:
create ‘表名’,‘列蔟名’…
创建订单表,表名为ORDER_INFO,该表有一个列蔟为C1
create ‘ORDER_INFO’,‘C1’;
注意:
⚫ create要写成小写
⚫ 一个表可以包含若干个列蔟
⚫ 命令解析:调用 hbase提供的ruby脚本的create方法,传递两个字符串参数
⚫ 通过下面链接可以看到每个命令都是一个ruby脚本
https://github.com/apache/hbase/tree/branch-2.1/hbase-shell/src/main/ruby/shell/comm
ands
2.3 查看表
hbase(main):005:0> list
TABLE
ORDER_INFO
1 row(s)
Took 0.0378 seconds
=> ["ORDER_INFO"]
2.4 删除表
要删除某个表,必须要先禁用表
2.4.1 禁用表
语法:disable “表名”
2.4.2 删除表
语法:drop “表名”
2.4.3 删除ORDER_INFO表
disable "ORDER_INFO"
drop "ORDER_INFO"
3 添加数据
3.1 需求
接下来,我们需要往订单表中添加以下数据。
3.2 PUT操作
HBase中的put命令,可以用来将数据保存到表中。但put一次只能保存一个列的值。以下是put的
语法结构:
put ‘表名’,‘ROWKEY’,‘列蔟名:列名’,‘值’
要添加以上的数据,需要使用7次put操作。如下:
put 'ORDER_INFO','000001','C1:ID','000001'
put 'ORDER_INFO','000001','C1:STATUS','已提交'
put 'ORDER_INFO','000001','C1:PAY_MONEY',4070
put 'ORDER_INFO','000001','C1:PAYWAY',1
put 'ORDER_INFO','000001','C1:USER_ID',4944191
put 'ORDER_INFO','000001','C1:OPERATION_DATE','2020-04-25 12:09:16'
put 'ORDER_INFO','000001','C1:CATEGORY','手机;'
4 查看添加的数据
4.1 需求
要求将rowkey为:000001对应的数据查询出来。
4.2 get命令
在HBase中,可以使用get命令来获取单独的一行数据。语法:get '表名','rowkey'
4.3 查询指定订单ID的数据
get 'ORDER_INFO','000001'
4.4 显示中文
在HBase shell中,如果在数据中出现了一些中文,默认HBase shell中显示出来的是十六进制编码
。
要想将这些编码显示为中文,我们需要在get命令后添加一个属性:FORMATTER => 'toString'
4.4.1 查看订单的数据
get 'ORDER_INFO','000001', FORMATTER => 'toString'
注:
⚫ key => value,这个是Ruby语法,表示定义一个HASH结构
⚫ get是一个HBase Ruby方法,’ORDER_INFO’、’000001’、FORMATTER => ‘toString’是put
方法的三个参数
⚫ FORMATTER要使用大写
⚫ 在Ruby中用表示一个字典,类似于hashtable,FORMATTER表示key、’toString’表示值
5 更新操作
5.1 需求
将订单ID为000001的状态,更改为「已付款」
5.2 使用put来更新数据
同样,在HBase中,也是使用put命令来进行数据的更新,语法与之前的添加数据一模一样。
5.3 更新指定的列
put 'ORDER_INFO', '000001', 'C1:STATUS', '已付款'
注意:
⚫ HBase中会自动维护数据的版本
⚫ 每当执行一次put后,都会重新生成新的时间戳
C1:STATUS timestamp=1588748844082, value=已提交
C1:STATUS timestamp=1588748952074, value=已付款
C1:STATUS timestamp=1588748994244, value=已付款
6 删除操作
6.1 删除状态列数据
6.1.1 需求
将订单ID为000001的状态列删除。
6.1.2 delete命令
在HBase中,可以使用delete命令来将一个单元格的数据删除。语法格式如下:
delete '表名', 'rowkey', '列蔟:列'。
注意:此处HBase默认会保存多个时间戳的版本数据,所以这里的delete删除的是最新版本的列数据。
6.1.3 删除指定的列
delete ‘ORDER_INFO’,‘000001’,‘C1:STATUS’
6.2 删除整行数据
6.2.1 需求
将订单ID为000001的信息全部删除(删除所有的列)
6.2.2 deleteall命令
deleteall命令可以将指定rowkey对应的所有列全部删除。语法:
deleteall '表名','rowkey'
6.2.3 删除指定的订单
deleteall ‘ORDER_INFO’,‘000001’
6.3 清空表
6.3.1 需求
将ORDER_INFO的数据全部删除
6.3.2 truncate命令
truncate命令用来清空某个表中的所有数据。语法:
truncate "表名"
6.3.3 清空ORDER_INFO的所有数据
truncate 'ORDER_INFO'
以上是关于Hbase常用shell操作的主要内容,如果未能解决你的问题,请参考以下文章