SQL:根据条件选择不同的用户和分组

Posted

技术标签:

【中文标题】SQL:根据条件选择不同的用户和分组【英文标题】:SQL: Selecting Distinct users and groupby based on condition 【发布时间】:2021-06-30 10:52:04 【问题描述】:

我有一个数据库表:

User_id | User Name | Join_date  | Activity_date |  
1           abc       01/01/2021    02-01-2021
2           jay       01/01/2021    03-01-2021
2           jay       01/01/2021    04-01-2021
1           abc       01/01/2021    09-01-2021
1           abc       01/01/2021    16-01-2021 
2           jay       01/01/2021    05-01-2021
3           xyz       03/03/2021    12-03-2021
3           xyz       03/03/2021    30-03-2021
2           jay       01/01/2021    26-01-2021

我想根据他们的Activity_date 对用户进行分桶,例如每隔一天进行活动的用户进入 table1,每周进行活动的用户(间隔 6-7 天)进入 table2,所有其他用户进入表3。

output 是这样的:

temporary_table1:(隔天做一次活动的人继续)

User_id | User Name | Join_date  | Activity_date |  
2           jay       01/01/2021    03-01-2021
2           jay       01/01/2021    04-01-2021
2           jay       01/01/2021    05-01-2021

temporary_table_2:(从第一个Activity_date开始每6-7天做一次活动的人)

User_id | User Name | Join_date  | Activity_date |  
1           abc       01/01/2021    02-01-2021
1           abc       01/01/2021    09-01-2021
1           abc       01/01/2021    15-01-2021 

temporary_table_3:(这里加上user_id =2,因为从这个用户最近的活动到最近的活动有超过7天的差距)

User_id | User Name | Join_date  | Activity_date |  
3           xyz       03/03/2021    12-03-2021
3           xyz       03/03/2021    30-03-2021
2           jay       01/01/2021    26-01-2021

如何在 SQL (Redshift) 中实现这一点?

【问题讨论】:

我删除了标签 [mysql] 和 [sql-server] 因为它们有冲突,并添加了 Amazon Redshift,正如您所说的那样,这是您真正使用的在结束语中。请确保在发布问题时正确标记。谢谢。 非常感谢您的建议和更新,我以后真的会更正它。 【参考方案1】:

你应该能够做这样的事情,然后你可以在 date_diff 上进行分组:

SELECT
user_id,
user_name,
join_date
activity_date,

#window function
LAG(activity_date) OVER (PARTITION BY user_id ORDER BY activity_date ASC) as day_before,

#difference in days between activity_date and day_before
DATEDIFF(
    day, 
    LAG(activity_date) OVER (PARTITION BY user_id ORDER BY activity_date ASC),
    activity_date
    ) as date_diff
FROM your_dataset

【讨论】:

以上是关于SQL:根据条件选择不同的用户和分组的主要内容,如果未能解决你的问题,请参考以下文章

如何按范围分组,或有条件地从查询结果中选择

在SQL中分组查询 Group by 的存在条件是啥

根据sql中的条件从不同的表中选择一个值

SQL Server:根据多个条件从组中选择特定行

根据 3 到 4 个条件对数据库表中的行进行计数和分组查询

当必须根据条件对记录进行分组时如何选择最多 x 行