大数据SQL题

Posted MISAYAONE

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据SQL题相关的知识,希望对你有一定的参考价值。

1:每个app下访问次数最多的5个用户

用户登陆日志
app, user_id, datetime
a1,user1,2020-01-01 00:00:00
a2,user2,2020-01-01 00:00:01
a3,user3,2020-01-01 00:00:02
a4,user4,2020-01-01 00:00:03
……
输出每个app下访问次数最多的5个用户

考察窗口函数

select app,userid,rank from (
select app, userid, row_number() over (partition by app,userid order by c desc) as rank
from (
    select app, userid, count(*) as c 
        from table group by app,userid
)
)
where rank <5

2:一定认识的用户的组合数

现有城市网吧访问数据,字段:网吧id,访客id(身份证号),上线时间,下线时间
规则1、如果有两个用户在一家网吧的前后上下线时间在10分钟以内,则两人可能认识
规则2、如果这两个用户在三家以上网吧出现【规则1】的情况,则两人一定认识
需求:
该城市上网用户中两人一定认识的组合数。

理解题目意思,梳理 join 条件,过滤符合条件的组合。

以上是关于大数据SQL题的主要内容,如果未能解决你的问题,请参考以下文章

大数据关于sql面试题10道,助你升职加薪精品,建议收藏

最强最全面的大数据SQL经典面试题(由31位大佬共同协作完成)

大数据 SQL 题目

大数据SQL题

大数据开发工程师之SQL面试题

大数据SQL题