对于k样本的scipy Anderson-Darling检验中的数学溢出错误

Question

我想用Kolmogorov-Smirnov（KS）和Anderson-Darling（AD）测试来比较样品对。我分别用scipy.stats.ks_2samp和scipy.stats.anderson_ksamp实现了它。我预计类似样本的统计数据较低（相同样本为0），更多不同样本的统计量较高。

在相同样本和非常不同的样本（无重叠）的情况下，ks_2samp提供了预期的结果，而anderson_ksamp为相同的样本提供了负值，更重要的是，对于非常不同的样本抛出了错误（可能是由于样本大小）：以下示例中的200）。

以下是说明这些发现的代码：

import scipy.stats as stats
import numpy as np
normal1 = np.random.normal(loc=0.0, scale=1.0, size=200)
normal2 = np.random.normal(loc=100, scale=1.0, size=200)

在相同的样品上使用KS和AD：

sstats.ks_2samp(normal1, normal1)
sstats.anderson_ksamp([normal1, normal1])

分别返回：

# Expected
Ks_2sampResult(statistic=0.0, pvalue=1.0) 
# Not expected
Anderson_ksampResult(statistic=-1.3196852620954158, critical_values=array([ 0.325,  1.226,  1.961,  2.718,  3.752]), significance_level=1.4357209285296726)

并在不同的样本上：

sstats.ks_2samp(normal1, normal2)
sstats.anderson_ksamp([normal1, normal2])

分别返回：

# Expected
Ks_2sampResult(statistic=1.0, pvalue=1.4175052453413253e-89)
# Not expected
---------------------------------------------------------------------------
OverflowError                             Traceback (most recent call last)
<ipython-input-757-e3914aaf909c> in <module>()
----> 1 stats.anderson_ksamp([normal1, normal2])

/usr/lib/python3.5/site-packages/scipy/stats/morestats.py in anderson_ksamp(samples, midrank)
   1694         warnings.warn("approximate p-value will be computed by extrapolation")
   1695 
-> 1696     p = math.exp(np.polyval(pf, A2))
   1697     return Anderson_ksampResult(A2, critical, p)
   1698 

OverflowError: math range error