如何使用窗口函数枚举 Postgres 表中的分区组?

Posted

技术标签:

【中文标题】如何使用窗口函数枚举 Postgres 表中的分区组?【英文标题】:How to enumerate groups of partitions in my Postgres table with window functions? 【发布时间】:2018-08-23 14:33:09 【问题描述】:

假设我有这样一张桌子:

id  | part  | value
----+-------+-------
 1  | 0     | 8
 2  | 0     | 3
 3  | 0     | 4
 4  | 1     | 6
 5  | 0     | 13
 6  | 0     | 4
 7  | 1     | 2
 8  | 0     | 11
 9  | 0     | 15
 10 | 0     | 3
 11 | 0     | 2

我想枚举具有部分属性 1 的行之间的组。

所以我想得到这个:

id  | part  | value | number
----+-------+-----------------
 1  | 0     | 8     |   1
 2  | 0     | 3     |   1
 3  | 0     | 4     |   1
 4  | 1     | 6     |   0
 5  | 0     | 13    |   2
 6  | 0     | 4     |   2
 7  | 1     | 2     |   0
 8  | 0     | 11    |   3
 9  | 0     | 15    |   3
 10 | 0     | 3     |   3
 11 | 0     | 2     |   3

是否可以使用 Postgres 窗口函数来实现这一点,或者还有其他方法吗?

【问题讨论】:

我不明白数字列中预期结果中的编号和“奇怪”顺序。你能详细说明一下吗? 这是不同的,因为在上一个问题中我要求枚举内部分区,而这里我问的是从外部枚举。 我们不理解“从外部枚举”。您必须更详细地解释它。 是的,我看到了你的另一个问题(***.com/questions/51984611/…),这更有意义。因为数字列遵循非常直接的算法。这个问题中的数字并不遵循非常直接的算法.. 我只想将表格分成某些部分,这些部分需要有一些数字来定义它们,并将它们与表格的其他部分分开。当部分列为 1 时,表的部分开始,零在哪里,这是以部分列再次为 1 结束的整个部分。 【参考方案1】:

您似乎想要比部分的累积总和多 1 之类的东西。最简单的方法是:

select t.*,
       (case when part = 1 then 0  -- the easy case
             else 1 + sum(part) over (order by id)
        end) as number
from t;

如果part 可以采用 0 和 1 以外的值:

select t.*,
       (case when part = 1 then 0  -- the easy case
             else 1 + sum( (part = 1)::int ) over (order by id)
        end) as number
from t;

【讨论】:

非常好的解决方案【参考方案2】:

如果我理解正确,你需要这样的东西:

with t(id  , part  , value) as(
values
(1  , 0     , 8),
(2  , 0     , 3),
(3  , 0     , 4),
(4  , 1     , 6),
(5  , 0     , 13),
(6  , 0     , 4),
(7  , 1     , 2),
(8  , 0     , 11),
(9  , 0     , 15),
(10 , 0     , 3),
(11 , 0     , 2)
)

select id, part, value, case when  part = 1 then 0 else dense_rank() over(order by grp) end as result
from (
    select *,
    row_number() over(order  by id)   -
    row_number() over(partition by part order  by id) as grp
    from t
    order by id
) tt
order by id

【讨论】:

以上是关于如何使用窗口函数枚举 Postgres 表中的分区组?的主要内容,如果未能解决你的问题,请参考以下文章

表中的更改列在 postgres 中具有枚举类型

表中的更改列在postgres中具有枚举类型

如何在带有 Postgres 的动态框架中使用窗口函数中的列值?

使用'parititon by'和窗口函数在postgres中返回多于一行?

postgres中的交叉表函数不返回表中的任何值

从 SQL 窗口函数中排除分区?