Hive sql 每天场景题 41

Posted 吃再多糖也不长胖

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive sql 每天场景题 41相关的知识,希望对你有一定的参考价值。

41、现有各直播间的用户访问记录表(live_events)如下,表中每行数据表达的信息为,一个用户何时进入了一个直播间,又在何时离开了该直播间

户访问记录表(live_events)如下

user_id
(用户id)

live_id
(直播间id)

in_datetime
(进入直播间的时间)

out_datetime
(离开直播间的时间)

100

1

2021-12-1 19:30:00

2021-12-1 19:53:00

100

2

2021-12-1 21:01:00

2021-12-1 22:00:00

101

1

2021-12-1 19:05:00

2021-12-1 20:55:00

现要求统计各直播间最大同时在线人数,期望结果如下:

live_id
<int>
(直播id)

max_user_count
<int>
(最大人数)

1

4

2

3

3

2

代码

with t1 as (
-- 时间  动作(登录+1,登出-1)
select
live_id
,in_datetime as check_time
,1 as action
from live_events
union all
select
live_id
,out_datetime as check_time
,-1 as action
from live_events
)

select 
-- 秒级求最大共同人数
live_id
,max(cn) as max_user_count
from (
select 
-- 时间  累加人数 (开窗sum()只要over()中没有partition by 就能实现累加)
live_id
,check_time
,action
,sum(action) over(partition by live_id order by check_time rows between unbounded preceding and current row) as cn
from t1
)a
group by live_id

以上是关于Hive sql 每天场景题 41的主要内容,如果未能解决你的问题,请参考以下文章

Hive sql 每天场景题45

Hive sql 每天场景题21-22

每天一道大厂SQL题Day02电商场景TopK统计

每天一道大厂SQL题Day02电商场景TopK统计

9大 HIVE SQL 最频繁被问到的面试题

面试题: Hive-SQL查询连续活跃登录用户思路详解