检验数据是不是服从正态分布

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了检验数据是不是服从正态分布相关的知识,希望对你有一定的参考价值。

参考技术A 在 SPSS 中,正态分布的检验方法有:计算偏度系数(Skewness)和峰度系数(Kurtosis)、Kolmogorov-Smirnov检验(KS检验或D检验)、Shapiro-Wilk(SW检验或W检验)、直方图、QQ图等。

首先需要有一组数据,如:74 75 78 77 80 80 90 76 62 79,按下述格式输入SPSS中。

依此点击 分析 - 描述统计 - 描述

就会看到下述图片,点击 绘制 ,我们可以选择输出图片(茎叶图、直方图),如果想要输出图片,在输出应该选择 两者都 。选择 确定 ,就可以看到结果了。

输出结果如何解读?

此表,是对数据的统计描述,我们可以关注下最下方的 偏度 (Skewness)和 峰度 (Kurtosis)。

偏度SK 越趋近0,数据越服从正态分布,众数=中位数=平均数;SK>0,为正偏态或左偏,众数<中位数<平均数;SK<0,为负偏态或右偏,众数>中位数>平均数。

峰度KG 越趋近3,数据越服从正态分布;KG>3,峰度尖锐;KG<3,峰度扁平。(或exceess_KG=KG-3,exceess_KG越趋近0,数据越服从正态分布)

但是仅根据偏度和峰度还不足以判断数据是否服从正态分布,需要做进一步的检验。

上表是生成的 KS检验(D检验) 和 SW检验(W检验) 的检验结果,此处我们关注的显著性是 Sig. 即 P 值。当 P >0.05时,可以认为数据是呈正态分布的。

由上表可以看出,KS检验和SW检验显著性均>0.05。

由于 样本数量 为10, 小样本 时关注 SW检验 的结果,所以此处显著性0.145,可以认为数据是正态分布的。

在输出结果部分还可以生成直方图、茎叶图、QQ图等,可以根据图形做出观测,若要检验是否服从正态分布还是需要用算法进行检测。

ref:https://mp.weixin.qq.com/s?__biz=MzIxNzEzODA5NQ==&mid=2649372170&idx=1&sn=7d374b9dddcf1dbea7a2f5cdc309b1d5&chksm=8fe0c0cab89749dcfa907f7504be1211b226f3d7b1093dfa5e621b0a0f33b1f1b1059d0438ad&scene=21#wechat_redirect

MATLAB利用QQ图检验总体是否服从多维正态分布


问题提出

考查鸢尾属植物中两个不同品种的花的如下四个形状指标: X 1 X_1 X1 位萼片长度; X 2 X_2 X2 位萼片宽度; X 3 X_3 X3 为花瓣长度; X 4 X_4 X4 为花瓣宽度。现验证:该形状指标数据(两个品种)总体是否服从四维正态分布?


数据

数据采用 鸢尾属植物两个不同品种的花的形状数据1,其中部分数据如下:

编号品种 x 1 x_1 x1 x 2 x_2 x2 x 3 x_3 x3 x 4 x_4 x4
1165284615
2162224515
50167305017
51264285622
52267315624
100263336025

问题的求解

数据预处理

将上述数据的四项形状指标数据保存于 datas.txt 文档中。

编写程序求解

MATLAB 代码如下:

X = load('datas.txt'); % 导入数据
[N, p] = size(X); 
d = mahal(X, X); % 计算马氏距离
d1 = sort(d); % 从小到大排序
pt = [[1:N] - 0.5] / N; % 计算分位数
x2 = chi2inv(pt, p); % 计算 X^2_t
plot(d1, x2, '*', [0:13], [0:13], '-r') % 作图

绘制图像如下:

从图像可以看出,数据点基本落在直线上,故不能拒绝该数据服从四维正态分布的假设。


  1. 数据来源:梅长林,范金城,数据分析方法,高等教育出版社。 ↩︎

以上是关于检验数据是不是服从正态分布的主要内容,如果未能解决你的问题,请参考以下文章

检验数据是不是服从正态分布

如何判断一组数据是不是为正态分布

卡方检验详解

MATLAB利用QQ图检验总体是否服从多维正态分布

MATLAB利用QQ图检验总体是否服从多维正态分布

Durbin Waston统计+Durbin Waston检验表