如何根据多列的顺序对 PostgreSQL 中的聚合进行分组？

Posted 2023-04-15

技术标签:

【中文标题】如何根据多列的顺序对 PostgreSQL 中的聚合进行分组？【英文标题】：How to group aggregates in PostgreSQL based on ordering of multiple columns? 【发布时间】：2017-06-21 18:10:29 【问题描述】：

给定一个表格“点”，例如：

time  | session_id  | trail_id
------------------------------
  1   |      1      |    1
  2   |      1      |    1
  3   |      1      |    3
  4   |      1      |    3
  5   |      1      |    3
  6   |      1      |    1
  7   |      1      |    1
  8   |      1      |    1
  9   |      1      |    1
  10  |      1      |    1

如何对这些项目进行分组，以便我可以在“session_id”上使用关于 trail_id 的聚合函数，同时按时间排序？即）我希望在 trail_id 随时间变化时拆分分组。

这样的查询：

SELECT count(session_id), session_id, trail_id
FROM <?>

会产生：

count  | session_id  | trail_id
-------------------------------
   2   |     1       |    1
   3   |     1       |    3
   5   |     1       |    1

我相信这可以通过窗口函数来完成，但到目前为止还没有成功。

以下内容并没有完全到达我需要的位置，因为它将所有的 trail_id 分组而不考虑时间：

SELECT session_id, trail_id, 
  first_value(time) OVER (PARTITION BY session_id, trail_id ORDER BY time) as v
FROM points

另外，在我的生产用例中，“points”表将是 JOIN 的结果，由几百万行组成。这些点将具有 PostGIS 几何类型并与 ST_MakeLine() 函数聚合。性能方面，在 PL/pgSQL 中尝试这样做会更好吗？

【问题讨论】：

【参考方案1】：

with points(time  , session_id  , trail_id) as(
    select 1   ,      1      ,    1 union all
    select  2   ,      1      ,    1 union all
    select  3   ,      1      ,    3 union all
    select  4   ,      1      ,    3 union all
    select  5   ,      1      ,    3 union all
    select  6   ,      1      ,    1 union all
    select  7   ,      1      ,    1 union all
    select  8   ,      1      ,    1 union all
    select  11   ,      1      ,    1 union all
    select  12  ,      1      ,    1  
)

select count(*), session_id, trail_id
from (
    select time, session_id, trail_id,
    row_number() over(order by time) -
    row_number() over(partition by session_id, trail_id order by time) as grp
    from points
)t
group by grp, session_id, trail_id
order by min(time)

嗯，这应该可以得到你需要的结果，但是如果

'points' 表将是 JOIN 的结果，包含几百万行

那么可能性能不会那么理想。试试看

【讨论】：

这很聪明！并且运作良好。不幸的是，这是一个概念证明，我将无法真正测试几周，所以我必须看看性能如何。

以上是关于如何根据多列的顺序对 PostgreSQL 中的聚合进行分组？的主要内容，如果未能解决你的问题，请参考以下文章