大数据SQL题
Posted MISAYAONE
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据SQL题相关的知识,希望对你有一定的参考价值。
1:每个app下访问次数最多的5个用户
用户登陆日志
app, user_id, datetime
a1,user1,2020-01-01 00:00:00
a2,user2,2020-01-01 00:00:01
a3,user3,2020-01-01 00:00:02
a4,user4,2020-01-01 00:00:03
……
输出每个app下访问次数最多的5个用户
考察窗口函数:
select app,userid,rank from (
select app, userid, row_number() over (partition by app,userid order by c desc) as rank
from (
select app, userid, count(*) as c
from table group by app,userid
)
)
where rank <5
2:一定认识的用户的组合数
现有城市网吧访问数据,字段:网吧id,访客id(身份证号),上线时间,下线时间
规则1、如果有两个用户在一家网吧的前后上下线时间在10分钟以内,则两人可能认识
规则2、如果这两个用户在三家以上网吧出现【规则1】的情况,则两人一定认识
需求:
该城市上网用户中两人一定认识的组合数。
理解题目意思,梳理 join 条件,过滤符合条件的组合。
以上是关于大数据SQL题的主要内容,如果未能解决你的问题,请参考以下文章