用户增长——Cohort Analysis 留存分析
Posted 悟乙己
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用户增长——Cohort Analysis 留存分析相关的知识,希望对你有一定的参考价值。
数据是会骗人的,尤其是平均数据(真实世界会有用户每个月下单2.5次吗?很可能是两个分别下单1次和4次的客户而已),一个中等的平均的用户画像其实完全是用数据创造出来的虚幻的形象。而一个漂亮的平均数所创造出来的这种虚幻景象,往往会给我们的决策造成误导。但是事实上,数据并不会说谎,只是分析数据的人没有做到精准分析而导致对数据呈现的错误解读!因此,Cohort Analysis的分析方法应运而生。
目前该系列的几篇:
用户增长——CLV用户生命周期价值CLTV 笔记(一)
用户增长 - BG/NBD概率模型预测用户生命周期LTV(二)
用户增长——Cohort Analysis 留存分析(三)
参考文章:
用户行为分析利器:同类群组分析
Cohort Analysis:用户在哪一步离开了我们的产品?
一、什么是Cohort Analysis?
Cohort其实是一个组群的意思, Cohort Analysis就是分组分析,也可以叫做同期分析。Cohort分析通过对性质完全一样的可对比群体的留存情况的比较,来发现哪些因素影响短、中、长期的留存。Cohort分析受到欢迎的另一个原因是它用起来十分简单,但却十分直观。相较与比较繁琐的损失分析,RFM或者用户聚类等,Cohort只用简单的一个图表,甚至连四则运算都不用,就直接描述了用户在一段时间周期(甚至是整个LTV[2])的留存(或流失)变化情况。
同类群组分析可以回答以下问题:
- 用户随着时间推移会如何表现?
- 不同群组之间的行为差异是什么?
- 自启动新产品/新功能以来,用户行为有何变化?
- 随着时间推移,留存率(retention rate)如何?
- 用户多快会使用一项新功能?
- 客户群中不同组的用户终身价值( customer lifetime value, CLV)是多少?
- 用户将来的行为会如何?
二、如何做Cohort Analysis?
首先我们了解一下两个概念:维度以及粒度。
维度:如果按用户的新增日期分组,那时间就是维度,如果按新增用户的渠道来源分组,渠道就是维度。
粒度:例如,时间维度是按照月划分、还是按照天划分;新增渠道维度是新增的来源产品还是来源的具体网址,这些都是粒度差异。
分组留存率计算起来比较简单,首先对用户进行分组,先按照维度分,再按照粒度分。通过基于这两方面的分组,可以将对比的差异值逐级锁定,寻找原因。
表1是一个典型的Cohort Analysis表格。该Cohort Analysis按照时间为维度,月份为粒度进行用户分组。
表1:Cohort Analysis表格
表1中,第一列为月份的排列,第二列为对应每个自然月中新增的用户数量。右侧表格即为当月新增的用户数量在后续每个月中的留存情况。那么这个图是怎么看的呢?
首先横向看表。1月份中,公司共有新增用户80个,当月流失用户2个,剩余的78个用户在2月份时又流失了3个,剩余75个用户在3月份时又流失了3个,剩余72个,以此类推,1月份的80个新增用户在11月的留存数量为64个。其他月份也是同样的分析方法,例如,4月份新增的110用户在8月的留存数量为99个。
其次纵向看表。5月份中,当月总下单用户数为477。其中,应该包括1月新增到5月留存的70个、2月新增到5月留存的82个、3月新增到5月留存的103个、4月新增到5月留存的107个以及5月刚刚新增的115个用户。
根据表1中的留存数据量,能够计算得到留存率,进而得到表2。
表2:留存率表
表2中,首先横向看表,能够看出每个月新增用户在后续各月的留存率情况。其次纵向看表,能够看出不同月份新增用户分别在下个月、下下个月等的留存表现如何。
三、Cohort Analysis表格中一家好的公司应有的趋势是什么?
对应表2中横向纵向两方面的分析,一家好的公司应该能够看到如下的趋势:
首先横向的留存数据终会在某个月份之后停留在一个固定的留存率上,比如A月获取的100个用户,在半年后每个月的留存率都稳定在60%,这就说明这60%的用户是稳定留存下来的。否则若留存率一直处在下降的状态,在若干月后将最终归零,即A月的留存客户为0。
其次纵向的留存数据应该是越来越好的。因为若公司和团队应该不断的根据历史情况改进产品和体验等,使得越后面加入的用户,能够享受到越好的产品及服务,从而导致后续月份的留存率越高。
根据Cohort分析我们可以更好的知道一家公司具体的运营情况,而且是分组的有时间延展性的。你可以看到每月的新增用户数量的变化情况,不同月份新增用户在后续每个月的留存情况,每个月的流失率情况等等。如果只看当月的总用户情况,那么上述这些问题都会被掩盖,尤其是新增用户数量大的时候,表面看起来公司用户是在增长,但很可能全都是靠新增用户拉动的。
四、一个案例总结
Cohort Analysis又叫队列分析,群组分析,是数据分析中常用的一种方法。Cohort Analysis的一般分析过程是将数据分成相同权重,连续的几个部分,然后对每部分数据做相同分析,最后做连续性讨论并得到结果。
总结:
A公司的的拉新留存工作做的很好,但是有一个问题:随着拉新数量增加,留存率会降低。可能的原因是拉新渠道变多,导致用户的精准程度下降。
可以采取的措施有:
对之前精准的用户渠道加大投放;
针对目标新用户增加新功能;
结论:B公司虽然拉新效果好,但是用户流失非常快,可能原因是产品功能没有做好或者拉新渠道有问题。B公司现在急需解决该问题,如果无法解决该问题,B公司是一家危险的公司。
进阶拓展
Cohort Analysis不单单可以用在用户留存上,支付金额,用户价值等指标都可以通过使用Cohort Analysis进行分析。
以上是关于用户增长——Cohort Analysis 留存分析的主要内容,如果未能解决你的问题,请参考以下文章