HIVEQL,每天记录的数量

Posted

技术标签:

【中文标题】HIVEQL,每天记录的数量【英文标题】:HIVEQL, COUNT AMOUNT OF RECORDS PER DAY 【发布时间】:2021-07-06 16:54:16 【问题描述】:

我在 hive 中有一个采用这种结构的数据库:

+--------+------------------+---------+
| rating |      date        | version |
+--------+------------------+---------+
| 3      | 2021-07-01 12:13 | 2.1.9   |
| 5      | 2021-07-01 10:39 | 2.2.6   |
| 4      | 2021-07-02 10:24 | 2.2.7   |
| 5      | 2021-07-02 05:37 | 3.2.4   |
| 1      | 2021-07-02 21:40 | 3.2.5   |

如何使用 HiveQL 获取每天和每月的记录数?

【问题讨论】:

【参考方案1】:

每天计数:

select substr(`date`,1,10) as `day`,
       count(*) cnt 
  from table_name 
 group by substr(`date`,1,10);

每月:

select substr(`date`,1,7) as `month`,
       count(*) cnt 
  from table_name 
 group by substr(`date`,1,7); 

【讨论】:

以上是关于HIVEQL,每天记录的数量的主要内容,如果未能解决你的问题,请参考以下文章

怎么查看hiveql执行时消耗的cpu核数

mysql查询每周的订单数量。

Hiveql - 将每小时数据汇总到每天

每天在 Mondrian MDX 中获取用户数量

iOS 8 Mapkit 和位置 - 每天的请求数量是不是有任何限制?

如何通过特定日期的唯一客户和重复客户获取每天的客户数量?