Postgresql 查询每 45 天显示一次记录
Posted
技术标签:
【中文标题】Postgresql 查询每 45 天显示一次记录【英文标题】:Postgresql Query for display of records every 45 days 【发布时间】:2016-01-14 05:12:39 【问题描述】:我有一个表,其中包含 user_id 数据和他们加入的时间戳。 如果我需要按月显示数据,我可以使用:
select
count(user_id),
date_trunc('month',(to_timestamp(users.timestamp))::timestamp)::date
from
users
group by 2
date_trunc 代码允许使用“秒”、“日”、“周”等。因此我可以得到按这些时间段分组的数据。 如何获取按“n 天”时间段(例如 45 天)分组的数据? 基本上我需要每 45 天显示用户数量。 任何建议或指导表示赞赏!
目前我得到:
Date Users
2015-03-01 47
2015-04-01 72
2015-05-01 123
2015-06-01 132
2015-07-01 136
2015-08-01 166
2015-09-01 129
2015-10-01 189
我希望数据以 45 天为间隔。类似的东西:-
Date Users
2015-03-01 85
2015-04-15 157
2015-05-30 192
2015-07-14 229
2015-08-28 210
2015-10-12 294
更新:
我使用以下方法获取输出,但仍然存在一个问题。我得到的值是偏移的。
with
new_window as (
select
generate_series as cohort
, lag(generate_series, 1) over () as cohort_lag
from
(
select
*
from
generate_series('2015-03-01'::date, '2016-01-01', '45 day')
)
t
)
select
--cohort
cohort_lag -- This worked. !!!
, count(*)
from
new_window
join users on
user_timestamp <= cohort
and user_timestamp > cohort_lag
group by 1
order by 1
但我得到的输出是:
Date Users
2015-04-15 85
2015-05-30 157
2015-07-14 193
2015-08-28 225
2015-10-12 210
基本上2015-03-01显示的用户应该是2015-03-01和2015-04-15之间的用户,以此类推。
但我似乎正在更新用户的价值。即:最多 2015-04-15 用户 85。这不是我想要的结果。 这里有什么帮助吗?
【问题讨论】:
你能给我看看你想要的结果吗? 显示示例输入及其预期输出 最新编辑解决了我的问题。感谢大家的帮助。 【参考方案1】:试试这个查询:
SELECT to_char(i::date,'YYYY-MM-DD') as date, 0 as users
FROM generate_series('2015-03-01', '2015-11-30','45 day'::interval) as i;
输出:
date users
2015-03-01 0
2015-04-15 0
2015-05-30 0
2015-07-14 0
2015-08-28 0
2015-10-12 0
2015-11-26 0
【讨论】:
如果我使用这个系列来生成我的序列。我得到的是累计用户总数,而不是 45 天范围内的单独用户总数。【参考方案2】:这看起来像一团糟,最好将它包装在一个可以使用一些变量的函数中,但是这样的东西可以吗?
with number_of_intervals as (
select
min (timestamp)::date as first_date,
ceiling (extract (days from max (timestamp) - min (timestamp)) / 45)::int as num
from users
),
intervals as (
select
generate_series(0, num - 1, 1) int_start,
generate_series(1, num, 1) int_end
from number_of_intervals
),
date_spans as (
select
n.first_date + 45 * i.int_start as interval_start,
n.first_date + 45 * i.int_end as interval_end
from
number_of_intervals n
cross join intervals i
)
select
d.interval_start, count (*) as user_count
from
users u
join date_spans d on
u.timestamp >= d.interval_start and
u.timestamp < d.interval_end
group by
d.interval_start
order by
d.interval_start
使用此示例数据:
User Id timestamp derived range count
1 3/1/2015 3/1-4/15
2 3/26/2015 "
3 4/4/2015 "
4 4/6/2015 " (4)
5 5/6/2015 4/16-5/30
6 5/19/2015 " (2)
7 6/16/2015 5/31-7/14
8 6/27/2015 "
9 7/9/2015 " (3)
10 7/15/2015 7/15-8/28
11 8/8/2015 "
12 8/9/2015 "
13 8/22/2015 "
14 8/27/2015 " (5)
这是输出:
2015-03-01 4
2015-04-15 2
2015-05-30 3
2015-07-14 5
【讨论】:
以上是关于Postgresql 查询每 45 天显示一次记录的主要内容,如果未能解决你的问题,请参考以下文章