比较 DB2 和 Hive 的行数

Posted

技术标签:

【中文标题】比较 DB2 和 Hive 的行数【英文标题】:Comparing row count for DB2 and Hive 【发布时间】:2017-08-28 08:23:13 【问题描述】:

我正在尝试编写一个 shell 脚本,在其中并检查它们是否匹配。 在做同样的事情时,我遇到了蜂巢数的问​​题。

当我在文本文件中计算蜂巢数时,它的格式如下:

+---------+--+
|   _c0   |
+---------+--+
| 713313  |
+---------+--+

之后我将表中的属性更改为 CSV(beeline --outputformat=tsv),现在输出如下:

'_c0'
'713313'

有什么方法可以让我们只得到计数?我不想使用 AWK 或 GREP 或 SED 来提取记录数。请务必告诉我。

【问题讨论】:

【参考方案1】:

最短路径:

count=`hive -S -e 'select count(*) from database.table_name'`

【讨论】:

感谢您快速回复。输出还是一样的。 [****@**** test_count]$ echo $count +------+--+ | _c0 | +-----+--+ | 421 | +-----+--+ 我只想提取计数。

以上是关于比较 DB2 和 Hive 的行数的主要内容,如果未能解决你的问题,请参考以下文章

HIVE/Impala 查询:计算满足特定条件的行之间的行数

db2,oracle,mysql ,sqlserver限制返回的行数

如何计算小于 Hive 表中特定行的行数?

SQL/Hive 查询以计算特定值每天的行数

通过 JBDC 获取在 IBM DB2 V6R1 (AS400) 上插入的行数

查询所有HIVE表分区数据量