如何使用窗口函数枚举 Postgres 表中的分区组?
Posted
技术标签:
【中文标题】如何使用窗口函数枚举 Postgres 表中的分区组?【英文标题】:How to enumerate groups of partitions in my Postgres table with window functions? 【发布时间】:2018-08-23 14:33:09 【问题描述】:假设我有这样一张桌子:
id | part | value
----+-------+-------
1 | 0 | 8
2 | 0 | 3
3 | 0 | 4
4 | 1 | 6
5 | 0 | 13
6 | 0 | 4
7 | 1 | 2
8 | 0 | 11
9 | 0 | 15
10 | 0 | 3
11 | 0 | 2
我想枚举具有部分属性 1 的行之间的组。
所以我想得到这个:
id | part | value | number
----+-------+-----------------
1 | 0 | 8 | 1
2 | 0 | 3 | 1
3 | 0 | 4 | 1
4 | 1 | 6 | 0
5 | 0 | 13 | 2
6 | 0 | 4 | 2
7 | 1 | 2 | 0
8 | 0 | 11 | 3
9 | 0 | 15 | 3
10 | 0 | 3 | 3
11 | 0 | 2 | 3
是否可以使用 Postgres 窗口函数来实现这一点,或者还有其他方法吗?
【问题讨论】:
我不明白数字列中预期结果中的编号和“奇怪”顺序。你能详细说明一下吗? 这是不同的,因为在上一个问题中我要求枚举内部分区,而这里我问的是从外部枚举。 我们不理解“从外部枚举”。您必须更详细地解释它。 是的,我看到了你的另一个问题(***.com/questions/51984611/…),这更有意义。因为数字列遵循非常直接的算法。这个问题中的数字并不遵循非常直接的算法.. 我只想将表格分成某些部分,这些部分需要有一些数字来定义它们,并将它们与表格的其他部分分开。当部分列为 1 时,表的部分开始,零在哪里,这是以部分列再次为 1 结束的整个部分。 【参考方案1】:您似乎想要比部分的累积总和多 1 之类的东西。最简单的方法是:
select t.*,
(case when part = 1 then 0 -- the easy case
else 1 + sum(part) over (order by id)
end) as number
from t;
如果part
可以采用 0 和 1 以外的值:
select t.*,
(case when part = 1 then 0 -- the easy case
else 1 + sum( (part = 1)::int ) over (order by id)
end) as number
from t;
【讨论】:
非常好的解决方案【参考方案2】:如果我理解正确,你需要这样的东西:
with t(id , part , value) as(
values
(1 , 0 , 8),
(2 , 0 , 3),
(3 , 0 , 4),
(4 , 1 , 6),
(5 , 0 , 13),
(6 , 0 , 4),
(7 , 1 , 2),
(8 , 0 , 11),
(9 , 0 , 15),
(10 , 0 , 3),
(11 , 0 , 2)
)
select id, part, value, case when part = 1 then 0 else dense_rank() over(order by grp) end as result
from (
select *,
row_number() over(order by id) -
row_number() over(partition by part order by id) as grp
from t
order by id
) tt
order by id
【讨论】:
以上是关于如何使用窗口函数枚举 Postgres 表中的分区组?的主要内容,如果未能解决你的问题,请参考以下文章
如何在带有 Postgres 的动态框架中使用窗口函数中的列值?