statsmodels中方差分析表结果解析

Posted sangf

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了statsmodels中方差分析表结果解析相关的知识,希望对你有一定的参考价值。

引言

通常我们在对多个变量进行统计分析的时候,结果的汇总和整理需要耗费大量的时间和精力,稍有不慎还有可能出现错误。因此在对多个变量统计分析的时候,使用自动化的脚本对结果进行整理和汇总就十分的方便了。
这里笔者使用Python当中的statsmodels模块,以方差分析为例进行演示和说明。

方差分析结果解析

import pandas as pd
df = pd.read_excel(r'20200104_test.xlsx', header=0, index_col=0)
df.head()

技术图片

import statsmodels.formula.api as smf
import statsmodels.api as sm

formula = f'A~C(Group)'
model = smf.ols(formula=formula, data=df).fit()
table = sm.stats.anova_lm(model, typ=3)
table

技术图片

f = table['F']['C(Group)']
p = table['PR(>F)']['C(Group)']
resDf = pd.DataFrame()
resDf = resDf.append({'F': f, 'P': p, 'Formula': formula}, ignore_index=True)
resDf.head()

技术图片

可以看到,这里table是方差分析的结果数据,可以通过类似map键值索引的方式去读取不同的数据。

事后检验结果解析

方差分析后,只能对组效应是否显著进行判断,但具体是哪几个组之间存在显著差异还需要进一步通过事后检验来确定。这里使用TukeyHSD检验。

from statsmodels.stats.multicomp import pairwise_tukeyhsd
from statsmodels.stats.multicomp import MultiComparison

mc = MultiComparison(df['A'], df['Group'])
mc_results = mc.tukeyhsd()
print(mc_results)

技术图片

meandiff = mc_results._results_table[1][2].data
meandiff

技术图片

参考

Analysis of Variance (ANOVA)
statsmodels

以上是关于statsmodels中方差分析表结果解析的主要内容,如果未能解决你的问题,请参考以下文章

PCA:主成分分析

CDA Level 1 方差分析和一元线性回归分析

斯坦福大学公开课机器学习: advice for applying machine learning | regularization and bais/variance(机器学习中方差和偏差如何相互

使用 STATSMODELS 的一种方法 Anova

用matlab的var函数求方差

比较方差的方法