数据分析数据分析方法:相关分析 & 群组分析

Posted 中传男明星皮皮

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析数据分析方法:相关分析 & 群组分析相关的知识,希望对你有一定的参考价值。

数据分析方法(六):相关分析 & 群组分析

1. 相关分析方法

当我们研究两种或者两种以上数据之间有什么关系的时候,就要用到相关分析。在解决问题的过程中,相关分析可以帮助我们扩大思路,将视野从一种数据扩大到多种数据。

通过计算相关系数,我们可以看到两种数据之间的相关程度。

相关关系不等于因果关系。在《简单统计学》中有一个例子,美国的啤酒销量和已婚人口的数量,二者的相关系数达到了惊人的 0.99。我们能说饮酒导致了婚姻?或者反过来说结婚导致了饮酒?显然,啤酒销量和已婚人口的数量没有因果关系,这纯属巧合。正确的解释应该是当人口随时间增长时,啤酒消费量、已婚人口数量也会增长。

大部分的时候是无法找到因果关系的,但是仅仅知道相关关系也能帮助我们。

2. 群组分析方法

群组分析方法(也叫同期群分析方法)是按某个特征将数据分为不同的组,然后比较各组的数据,说白了就是对数据分组然后来对比。

例如,在校上体育课的时候。体育老师考虑到男生和女生的运动项目不一样,会把男生分为一组打篮球,女生分为一组跳绳,这其实是按性别对学生进行了分组。在职场里常见的分组就是公司为了方便沟通,也会按项目建立不同的微信群。

产品会随着时间发布新的版本。产品改版的效果如何?版本更新后用户是增长了,还是流失了?

像这类问题,就需要将用户按时间分组,然后比较不同组的用户留存率。所以,群组分析方法常用来分析用户留存率(或者流失率)随时间发生了哪些变化,然后找出用户留下或者离开的原因。分组后,考察每组用户的留存率随着时间发生了哪些变化,例如 1 个月后留存率是多少,2 个月后留存率是多少。对于留存率高的用户组,分析他们为什么留存;对留存率低的用户组,分析他们为什么流失。


在我之前的一篇博客,【数据分析】基于RFM模型的线上零售中的客户细分(二):RFM模型实战,通过一个实际营销案例,详细介绍了用 Python 如何完成同期群分析。

以上是关于数据分析数据分析方法:相关分析 & 群组分析的主要内容,如果未能解决你的问题,请参考以下文章

数据分析数据分析方法:相关分析 & 群组分析

R语言进行宏基因组(菌群丰度)与环境因子的相关性分析

在滴定分析中,测定常量组分时标准溶液的浓度范围一般是多少?标准溶液的浓度过大或过小各有啥不妥?

在滴定分析中,测定常量组分时标准溶液的浓度范围一般是多少?标准溶液的浓度过大或过小各有啥不妥?

精馏塔控制系统的仿真与分析

单组学的多变量分析 2.稀疏偏最小二乘判别分析(sPLS-DA)