Hbase统计表总行数的三种方式

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hbase统计表总行数的三种方式相关的知识,希望对你有一定的参考价值。

参考技术A 1. 使用HBase Shell自带的count命令统计:count 'hbase_table'

2. 使用HBase自带的MapReduce统计工具统计行数;
$HBASE_HOME/bin/hbase org.apache.hadoop.hbase.mapreduce.RowCounter

3. 使用Hive创建外表关联HBase数据表,然后使用SQL语句统计查询;
对于存在的hbase表,在hive中创建关联表,然后使用语句统计总行数
#select count(*) from Test;

统计HBase表行数的四种方式

参考技术A

有时候我们需要统计HBase表的行数,一般要么是写MR程序,要么是写SQL。以下就是可用的几种方式:

HBase Shell 自带的统计函数命令
hbase> count \'t1\'
hbase> count \'t1\',INTERVAL => 100000
hbase> count \'t1\', CACHE => 1000
hbase> count \'t1\', INTERVAL => 10, CACHE => 1000

注意 :其中, INTERVAL 为统计的行数间隔,默认为1000, CACHE 为统计的数据缓存。这种方式效率很低,如果表行数很大的话不建议采用这种方式。

hbase org.apache.hadoop.hbase.mapreduce.RowCounter \'tablename\'

解释:这种方式效率比上一种要高很多,调用的hbase jar中自带的统计行数的类。

创建 Hive 与 HBase 的关联表,将 HBase 当作 Hive 的外部表。

以上是关于Hbase统计表总行数的三种方式的主要内容,如果未能解决你的问题,请参考以下文章

Android studio统计项目总行数

linux下如何统计一个目录下的文件个数以及代码总行数的命令

时序预测的三种方式:统计学模型机器学习循环神经网络

Android Studio 统计项目的代码总行数

Android Studio 统计项目的代码总行数

统计单词数目的三种解法