如何添加计数以对 SQL Hive 中的空值进行排名?
Posted
技术标签:
【中文标题】如何添加计数以对 SQL Hive 中的空值进行排名?【英文标题】:How I can I add a count to rank null values in SQL Hive? 【发布时间】:2020-09-01 13:04:02 【问题描述】:这就是我现在拥有的:
| time | car_id | order | in_order |
|-------|--------|-------|----------|
| 12:31 | 32 | null | 0 |
| 12:33 | 32 | null | 0 |
| 12:35 | 32 | null | 0 |
| 12:37 | 32 | 123 | 1 |
| 12:38 | 32 | 123 | 1 |
| 12:39 | 32 | 123 | 1 |
| 12:41 | 32 | 123 | 1 |
| 12:43 | 32 | 123 | 1 |
| 12:45 | 32 | null | 0 |
| 12:47 | 32 | null | 0 |
| 12:49 | 32 | 321 | 1 |
| 12:51 | 32 | 321 | 1 |
我正在尝试对订单进行排名,包括那些具有空值的订单,在本例中是按 car_id。 这是我正在寻找的结果:
| time | car_id | order | in_order | row |
|-------|--------|-------|----------|-----|
| 12:31 | 32 | null | 0 | 1 |
| 12:33 | 32 | null | 0 | 1 |
| 12:35 | 32 | null | 0 | 1 |
| 12:37 | 32 | 123 | 1 | 2 |
| 12:38 | 32 | 123 | 1 | 2 |
| 12:39 | 32 | 123 | 1 | 2 |
| 12:41 | 32 | 123 | 1 | 2 |
| 12:43 | 32 | 123 | 1 | 2 |
| 12:45 | 32 | null | 0 | 3 |
| 12:47 | 32 | null | 0 | 3 |
| 12:49 | 32 | 321 | 1 | 4 |
| 12:51 | 32 | 321 | 1 | 4 |
我只是不知道如何管理空值的计数。 谢谢!
【问题讨论】:
【参考方案1】:可以统计每行前非NULL值的个数,然后使用dense_rank()
:
select t.*,
dense_rank() over (partition by car_id order by grp) as row
from (select t.*,
count(order) over (partition by car_id order by time) as grp
from t
) t;
【讨论】:
感谢您的帮助! @VictorSerra 。 . .如果这回答了问题,您可以接受答案(作为 OP,您只能接受一个答案,但只有一个答案)。以上是关于如何添加计数以对 SQL Hive 中的空值进行排名?的主要内容,如果未能解决你的问题,请参考以下文章