Postgresql 查询每 45 天显示一次记录

Posted

技术标签:

【中文标题】Postgresql 查询每 45 天显示一次记录【英文标题】:Postgresql Query for display of records every 45 days 【发布时间】:2016-01-14 05:12:39 【问题描述】:

我有一个表,其中包含 user_id 数据和他们加入的时间戳。 如果我需要按月显示数据,我可以使用:

select 
 count(user_id), 
 date_trunc('month',(to_timestamp(users.timestamp))::timestamp)::date
from 
 users 
group by 2

date_trunc 代码允许使用“秒”、“日”、“周”等。因此我可以得到按这些时间段分组的数据。 如何获取按“n 天”时间段(例如 45 天)分组的数据? 基本上我需要每 45 天显示用户数量。 任何建议或指导表示赞赏!

目前我得到:

Date           Users
2015-03-01      47
2015-04-01      72
2015-05-01      123
2015-06-01      132
2015-07-01      136
2015-08-01      166
2015-09-01      129
2015-10-01      189

我希望数据以 45 天为间隔。类似的东西:-

Date           Users
2015-03-01      85
2015-04-15      157
2015-05-30      192
2015-07-14      229
2015-08-28      210
2015-10-12      294

更新:

我使用以下方法获取输出,但仍然存在一个问题。我得到的值是偏移的。

with
new_window as (
select
  generate_series as cohort
  , lag(generate_series, 1) over () as cohort_lag

from
  (
    select
      *
    from
      generate_series('2015-03-01'::date, '2016-01-01', '45 day')
  )
  t
)
select
  --cohort
  cohort_lag -- This worked. !!!
  , count(*)
from
  new_window
join users on
  user_timestamp <= cohort
  and user_timestamp > cohort_lag
group by 1
order by 1

但我得到的输出是:

Date           Users
2015-04-15      85
2015-05-30      157
2015-07-14      193
2015-08-28      225
2015-10-12      210

基本上2015-03-01显示的用户应该是2015-03-01和2015-04-15之间的用户,以此类推。

但我似乎正在更新用户的价值。即:最多 2015-04-15 用户 85。这不是我想要的结果。 这里有什么帮助吗?

【问题讨论】:

你能给我看看你想要的结果吗? 显示示例输入及其预期输出 最新编辑解决了我的问题。感谢大家的帮助。 【参考方案1】:

试试这个查询:

SELECT to_char(i::date,'YYYY-MM-DD') as date, 0 as users 
FROM generate_series('2015-03-01', '2015-11-30','45 day'::interval) as i;

输出:

date        users
2015-03-01    0
2015-04-15    0
2015-05-30    0
2015-07-14    0
2015-08-28    0
2015-10-12    0
2015-11-26    0

【讨论】:

如果我使用这个系列来生成我的序列。我得到的是累计用户总数,而不是 45 天范围内的单独用户总数。【参考方案2】:

这看起来像一团糟,最好将它包装在一个可以使用一些变量的函数中,但是这样的东西可以吗?

with number_of_intervals as (
  select
    min (timestamp)::date as first_date,
    ceiling (extract (days from max (timestamp) - min (timestamp)) / 45)::int as num
  from users
),
intervals as (
  select
    generate_series(0, num - 1, 1) int_start,
    generate_series(1, num, 1) int_end
  from number_of_intervals
),
date_spans as (
  select
    n.first_date + 45 * i.int_start as interval_start,
    n.first_date + 45 * i.int_end as interval_end
  from
    number_of_intervals n
    cross join intervals i    
)
select
  d.interval_start, count (*) as user_count
from
  users u
  join date_spans d on
    u.timestamp >= d.interval_start and
    u.timestamp <  d.interval_end
group by
  d.interval_start
order by
  d.interval_start

使用此示例数据:

User Id     timestamp       derived range   count
1           3/1/2015        3/1-4/15    
2           3/26/2015       "   
3           4/4/2015        "   
4           4/6/2015        "               (4)
5           5/6/2015        4/16-5/30   
6           5/19/2015       "               (2)
7           6/16/2015       5/31-7/14   
8           6/27/2015       "   
9           7/9/2015        "               (3)
10          7/15/2015       7/15-8/28   
11          8/8/2015        "   
12          8/9/2015        "   
13          8/22/2015       "   
14          8/27/2015       "               (5)

这是输出:

2015-03-01      4
2015-04-15      2
2015-05-30      3
2015-07-14      5

【讨论】:

以上是关于Postgresql 查询每 45 天显示一次记录的主要内容,如果未能解决你的问题,请参考以下文章

PostgreSQL查询:编写查询返回每组连续数字的最大值[重复]

postgresql数据库中的 rownum

postgresql按工作日选择,包括rails中的空记录

PostgreSQL 交叉表查询

PostgreSQL 交叉表查询

PostgreSQL 交叉表查询