scipy.stats.anderson 测试临界值

Posted

技术标签:

【中文标题】scipy.stats.anderson 测试临界值【英文标题】:scipy.stats.anderson test critical values 【发布时间】:2014-04-02 15:46:10 【问题描述】:

我用scipy.stats.anderson() 来 检验正态分布。 我的测试分布不是正态分布, 因此 teststatistic > 临界值。 但是,当检查所有计算的临界值时 我观察到,对于降低 p 值,临界值正在增加。 这意味着,测试越关键(p 值越小), 越接近检验统计量的临界值。 在我看来,这应该是另一种方式。 有人熟悉 Anderson 测试及其在 Scipy 中的实现吗?

【问题讨论】:

【参考方案1】:

我上次进行抽查时,scipy.stats.anderson 工作正常。对于针对正态分布的 Anderson-Darling 检验,statsmodels 有一个函数可以返回 p 值 http://statsmodels.sourceforge.net/devel/generated/statsmodels.stats.diagnostic.normal_ad.html

临界值适用于给定的显着性水平。当我们想要更小的显着性水平时,我们必须增加临界值,假设我们位于分布的右上尾。

http://en.wikipedia.org/wiki/Statistical_significance

例如对于 z 检验,基于正态分布的一侧上尾临界值为:

>>> from scipy import stats
>>> stats.norm.ppf([0.9, 0.95, 0.975])
array([ 1.28155157,  1.64485363,  1.95996398])

相比之下,P 值计算给定观察值处的尾部概率,观察值越大,p 值越小,同样在右上尾的情况下。

在您的示例中,如果观察值高于 10% 水平的临界值,那么它仍可能低于 5% 水平的临界值。在这种情况下,我们会在 10% 而不是 5% 的水平上拒绝原假设。

【讨论】:

确实,你是对的。感谢您向我指出 statsmodels。我实际上是在寻找一个返回 p 值的函数。

以上是关于scipy.stats.anderson 测试临界值的主要内容,如果未能解决你的问题,请参考以下文章

对于k样本的scipy Anderson-Darling检验中的数学溢出错误

测试和设置指令如何满足(或不满足)临界区方法的条件

[面试题][总结]100层楼丢玻璃球测试临界可破层数,用两个一模一样的球来测试计算尽可能少的次数?

不要妄图走捷径

mutex和CRITICAL_SECTION,互斥和临界区

Kolmogorov-Smirnov 检验中的假设检验 - 无论是临界值还是 p 值