如何在postgres中对几个月的日期记录分组后填补时间间隔

Posted

技术标签:

【中文标题】如何在postgres中对几个月的日期记录分组后填补时间间隔【英文标题】:How to fill the time gap after grouping date record for months in postgres 【发布时间】:2021-03-26 03:43:04 【问题描述】:

我的表记录为 -

date                n_count
2020-02-19 00:00:00  4
2020-07-14 00:00:00  1
2020-07-17 00:00:00  1
2020-07-30 00:00:00  2
2020-08-03 00:00:00  1
2020-08-04 00:00:00  2
2020-08-25 00:00:00  2
2020-09-23 00:00:00  2
2020-09-30 00:00:00  3
2020-10-01 00:00:00  11
2020-10-05 00:00:00  12
2020-10-19 00:00:00  1
2020-10-20 00:00:00  1
2020-10-22 00:00:00  1
2020-11-02 00:00:00  376
2020-11-04 00:00:00  72
2020-11-11 00:00:00  1

我想将所有记录分组为月份,以查找有效的月份总数,但缺少月份。如何填补这个空白。

time           month_count
"2020-02-01"    4
"2020-07-01"    4
"2020-08-01"    5
"2020-09-01"    5
"2020-10-01"    26
"2020-11-01"    449

这是我尝试过的。

SELECT (date_trunc('month', date))::date AS time,
       sum(n_count) as month_count      
FROM table1
group by time
order by time asc

【问题讨论】:

【参考方案1】:

我只想UNION 一个日期系列,从MINMAX 日期生成:

demo:db<>fiddle

WITH cte AS (                                      -- 1
    SELECT
        *,
        date_trunc('month', date)::date AS time
    FROM
        t
)
SELECT 
    time,
    SUM(n_count) as month_count                    --3
FROM (
    SELECT
        time,
        n_count
    FROM cte

    UNION

    SELECT                                        -- 2
        generate_series(
            (SELECT MIN(time) FROM cte),
            (SELECT MAX(time) FROM cte),
            interval '1 month'
        )::date,
        0
) s
GROUP BY time
ORDER BY time
    使用 CTE 只计算一次 date_trunc。如果您想在下面的UNION 中两次调用您的表,可以省略 从MINMAX 生成包含您的n_count value = 0 日期的每月日期系列。将其添加到表格中 算一算

【讨论】:

谢谢。这实际上解决了我的问题。【参考方案2】:

您可以使用generate_series() 生成表格中可用的最早日期和最晚日期之间的所有月份开始日期,然后将表格带上left join

select d.dt, coalesce(sum(t.n_count), 0) as month_count      
from (
    select generate_series(date_trunc('month', min(date)), date_trunc('month', max(date)), '1 month') as dt 
    from table1
) as d(dt)
left join table1 t on t.date >= d.dt and t.date < d.dt + interval '1 month'
group by d.dt
order by d.dt

【讨论】:

以上是关于如何在postgres中对几个月的日期记录分组后填补时间间隔的主要内容,如果未能解决你的问题,请参考以下文章

如何在 MDX 中对同一维度进行分组和过滤

如何从当前日期 PHP 获取最近 7 周、7 个月的日期范围?

SQL 使用两个提前 16 个月的日期字段返回记录

每月每个类别的分组计数(当前月份与过去几个月的剩余时间)在 pandas 的单独列中

前几个月的 SQL 固定日期

获取几个月的最新记录并使用 Oracle PL-SQL 为每个 ID 汇总其值