Hive面试题系列第三题-用户留存问题
Posted 一只懒得睁眼的猫
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive面试题系列第三题-用户留存问题相关的知识,希望对你有一定的参考价值。
Hive面试题系列第三题-用户留存问题
题目:求用户1日、3日、7日留存率
概念问题:
第N日活跃用户留存率:以基准日的活跃用户数为主,第N日后依然活跃的用户占基准日活跃用户的比例
第1日留存率(即次日留存):(以基准日当天活跃的用户中,基准日之后的第1天还活跃的用户数)/基准日当天总活跃用户数;
第3日留存率:(以基准日当天活跃的用户中,基准日之后的第3天还活跃的用户数)/基准日当天总活跃用户数;
第7日留存率:(以基准日当天活跃的用户中,基准日之后的第7天还活跃的用户数)/基准日当天总活跃用户数。
表结构:
- create table user_log(
-
userid bigint,
-
time string
- )
- row format delimited
- FIELDS TERMINATED BY ‘|’
- LINES TERMINATED BY ‘\\n’;
用户表数据: - 1 2019-07-11 01:44:27
- 1 2019-07-12 02:44:27
- 1 2019-07-14 03:44:27
- 1 2019-07-16 04:44:27
- 1 2019-07-17 05:44:27
- 1 2019-07-18 06:44:27
- 1 2019-07-19 07:44:27
- 1 2019-07-21 08:44:27
- 2 2019-07-11 01:44:27
- 2 2019-07-12 02:44:27
- 2 2019-07-13 04:44:27
- 2 2019-07-14 06:44:27
- 2 2019-07-15 07:44:27
- 2 2019-07-16 12:44:27
- 2 2019-07-17 13:44:27
- 2 2019-07-18 23:44:27
- 3 2019-07-11 02:44:27
- 3 2019-07-13 03:44:27
- 3 2019-07-14 06:44:27
- 3 2019-07-17 07:44:27
- 3 2019-07-19 09:44:27
- 3 2019-07-20 10:44:27
- 3 2019-07-21 11:44:27
- 3 2019-07-22 12:44:27
以上是关于Hive面试题系列第三题-用户留存问题的主要内容,如果未能解决你的问题,请参考以下文章