皮尔逊斯皮尔曼肯德尔等级应用场景及代码实现(附Python代码)
Posted 文宇肃然
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了皮尔逊斯皮尔曼肯德尔等级应用场景及代码实现(附Python代码)相关的知识,希望对你有一定的参考价值。
本文结合Python的scipy.stats
,简单梳理皮尔逊Pearson
、斯皮尔曼Spearman
、肯德尔等级Kendallta
三个相关系数的运用场景;及Python中如何计算三个相关系数。
1、统计学中常见变量类型
方便下文理解,先简单梳理下统计学中常用的变量类别
,
统计学中常用的变量类别
2、皮尔逊相关系数(Pearson)
使用前提:大小一致、连续、服从正态分布的数据集
,以下为scipy中描述:
scipy.stats.pearsonr(x, y)
The Pearson correlation coefficient measures the linear relationship between two datasets 「衡量两组数据的线性相关性
」.
The calculation of the p-value relies on the assumption that each dataset is normally distributed「假设两组数据服从正态分布,即数据必须是连续型数据(continuous)
」.
Like other correlation coefficients, this one varies between -1 and +1
以上是关于皮尔逊斯皮尔曼肯德尔等级应用场景及代码实现(附Python代码)的主要内容,如果未能解决你的问题,请参考以下文章
相关性Correlations 皮尔逊相关系数(pearson)和斯皮尔曼等级相关系数(spearman)