正态分布检验方法 Epps-Pulley 与 Python 实现

Posted 2022-01-18 zhuo木鸟

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了正态分布检验方法 Epps-Pulley 与 Python 实现相关的知识，希望对你有一定的参考价值。

文章目录

原理介绍
应用步骤
Python 实现
Monte-Carlo 法产生临界值

本文主要参考：

GB/T 4882-2001《数据的统计处理和解释正态性检验》；
A test for normality based on the empirical characteristic function；作者： T. W. EPPS，年份：1983；
An approximation to the limit distribution of the epps-pulley test statistic for normality；作者：henze，年份：1990；
Recent and classical tests for normality - a comparative study；作者：henze；年份：1989

原理介绍

随机变量 $X_1, X_2, \\cdots, X_n$ 来同一总体分布 $F (x)$ ，其经验特征函数为 $\\Phi_n (t) = n^-1 \\sum_j \\exp(i t X_j)$ ，其中 $t$ 是一个
任意取值的实值参数，经验特征函数总会收敛于总体的特征函数 $\\Phi(t)$ 。总体分布 $F (x)$ 与特征函数 $\\Phi(t)$ 呈一一对应的关系（特征函数是总体的概率密度函数的傅里叶变换），因此可以考虑使用经验特征函数 $\\Phi_n(t)$ 做为检验统计量，来判断总体分布 $F (x)$ 是否为正态分布。

小知识：总体累计分布函数 $F (x)$ 对应样本的经验分布函数 $F_n(x)=n^-1 \\sum_j I(X_j \\leq x)$ ；
同样的，总体的特征函数 $\\Phi(t)$ 也对应样本的经验分布函数 $\\Phi_n(t) = n^-1 \\sum_j (i t X_j)$

在正态分布的情况下，总体特征函数为 $\\Phi_0(t) = \\exp(i t \\mu - 1/2 t^2 \\sigma^2)$ ，其中 $\\mu, \\sigma^2$ 为均值和方差。于是可以将检验统计量取值为，对区间 t 范围内的 $\\Phi_n(t) - \\hat\\Phi _0(t)$ 平方模加权， $\\hat\\Phi_0(t) = \\exp(i t \\mu - 1/2 t^2 \\sigma^2)$ ，此时的 $\\mu, \\sigma$ 为样本的均值和方差的估计。

具体如下：
$T_n = \\int_-\\infty^\\infty |\\Phi_n(t) - \\hat\\Phi_0 (t) |^2 d G(t)$
其中 $\\hat\\Phi_n(t)=\\exp(it \\barX - 1/2 t^2 S^2)$ ， $\\barX$ 为样本均值， $S^2$ 为样本的二阶中心矩， $S^2 = \\frac\\sum_j=1^n(X_j - \\barX)^2n$ 。

权重系数 $G (t)$ 的选择应符合如下要求：

对 $|\\Phi_1(t) - \\Phi_0(t)|$ 赋予大系数。这是因为 $\\Phi_1(t)$ 属于多数备择假设。若输入标准化形式（减均值除方差），则多数的连续型分布在区间 $t\\in(0,3)$ 下， $|\\Phi_1(t)- \\Phi_0(t)$ 都是很大的。
当 $\\Phi_n(t)$ 是对 $\\Phi(t)$ 的精确拟合时，赋予较大权重。根据：
$E\\|\\Phi_n(t) - \\Phi(t)|^2\\ = n^-1 \\1 - |\\Phi(t)|^2\\$
由于