Hive面试题系列第三题-用户留存问题

Posted 一只懒得睁眼的猫

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive面试题系列第三题-用户留存问题相关的知识,希望对你有一定的参考价值。

视频讲解地址:https://www.bilibili.com/video/BV1Rd4y1T7iU/?spm_id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178

Hive面试题系列第三题-用户留存问题

题目:求用户1日、3日、7日留存率
概念问题:
第N日活跃用户留存率:以基准日的活跃用户数为主,第N日后依然活跃的用户占基准日活跃用户的比例
第1日留存率(即次日留存):(以基准日当天活跃的用户中,基准日之后的第1天还活跃的用户数)/基准日当天总活跃用户数;
第3日留存率:(以基准日当天活跃的用户中,基准日之后的第3天还活跃的用户数)/基准日当天总活跃用户数;
第7日留存率:(以基准日当天活跃的用户中,基准日之后的第7天还活跃的用户数)/基准日当天总活跃用户数。
表结构:

  1. create table user_log(
  2.  userid bigint,           
    
  3.  time string              
    
  4. )
  5. row format delimited
  6. FIELDS TERMINATED BY ‘|’
  7. LINES TERMINATED BY ‘\\n’;
    用户表数据:
  8. 1 2019-07-11 01:44:27
  9. 1 2019-07-12 02:44:27
  10. 1 2019-07-14 03:44:27
  11. 1 2019-07-16 04:44:27
  12. 1 2019-07-17 05:44:27
  13. 1 2019-07-18 06:44:27
  14. 1 2019-07-19 07:44:27
  15. 1 2019-07-21 08:44:27
  16. 2 2019-07-11 01:44:27
  17. 2 2019-07-12 02:44:27
  18. 2 2019-07-13 04:44:27
  19. 2 2019-07-14 06:44:27
  20. 2 2019-07-15 07:44:27
  21. 2 2019-07-16 12:44:27
  22. 2 2019-07-17 13:44:27
  23. 2 2019-07-18 23:44:27
  24. 3 2019-07-11 02:44:27
  25. 3 2019-07-13 03:44:27
  26. 3 2019-07-14 06:44:27
  27. 3 2019-07-17 07:44:27
  28. 3 2019-07-19 09:44:27
  29. 3 2019-07-20 10:44:27
  30. 3 2019-07-21 11:44:27
  31. 3 2019-07-22 12:44:27

以上是关于Hive面试题系列第三题-用户留存问题的主要内容,如果未能解决你的问题,请参考以下文章

Hive面试题系列第三题-用户留存问题

Hive面试题系列第一题-连续登录问题

Hive面试题系列第一题-连续登录问题

Hive面试题系列第一题-连续登录问题

Hive面试题系列第六题-互为好友问题

Hive面试题系列第六题-互为好友问题