python实现卡方(Chi-Squared Test)相关性检验

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python实现卡方(Chi-Squared Test)相关性检验相关的知识,希望对你有一定的参考价值。

python实现卡方(Chi-Squared Test)相关性检验

 

独立性检验是统计学的一种检验方式,与适合性检验同属于X2检验,即卡方检验(英文名:chi square test),它是根据次数资料判断两类因子彼此相关或相互独立的假设检验。

由联表中的数据算出随机变量K^2的值(即K的平方),K^2的值越大,说明“X与Y有关系”成立的可能性越大。

测试两个类别变量是相关的还是独立的。

假设条件

  • 计算列联表时使用的观察是独立的。
  • 列联表的每个单元格中有25个或更多示例。

解释

  • H0:两个样本是独立的。
  • H1:样本之间存在依赖性。

#

# Example of the Chi-Squared Test
from scipy.stats import chi2_contingency
table = [[10, 20, 30],[6,  9,  17]]
stat, p, dof, expected = chi2_contingency(table)
print(\'stat=%.3f, p=%.3f\' % (stat, p))
if p > 0.05:
	print(\'Probably independent

以上是关于python实现卡方(Chi-Squared Test)相关性检验的主要内容,如果未能解决你的问题,请参考以下文章

Scikit-learn χ²(卡方)统计量和相应的列联表

Python 卡方检验

4. 抽样分布—卡方分布F分布t分布Beta分布Gamma分布——python实战

卡方输出为向量

机器学习sklearn(十七): 特征工程特征选择卡方选择卡方检验

python生成卡方分布