数据的正态分布验证和方差齐性检验
Posted 一周一paper,一周一技术
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据的正态分布验证和方差齐性检验相关的知识,希望对你有一定的参考价值。
在对数据进行统计分析之前,应该先查看数据的特征,然后根据其特征选择分析方法。
很多统计假设方法要求数据是符合正态分布的和方差齐性。
1.数据的正态分布验证:
- 夏皮罗-威尔克(Shapiro-Wilk)检验法,适用于3 < 样本数< 5000 时的正态性检验。
> data2 [1] 10 7 20 14 14 12 10 23 17 20 14 13 > a=shapiro.test(data2) > a Shapiro-Wilk normality test data: data2 W = 0.95757, p-value = 0.7487 ##p值表示这个数据群是正态分布的概率
2.方差齐性检验
Bartlett检验 - 如果我们的数据服从正态分布,那么这种方法将是最为适用的。对于正态分布的数据,这种检验极为灵敏;而当数据为非正态分布时,使用该方法则很容易导致假阳性误判。
> data count spray 1 10 A 2 7 A 3 20 A 4 14 A 5 14 A 6 12 A 7 10 A 8 23 A 9 17 A 10 20 A 11 14 A 12 13 A 13 11 B 14 17 B 15 21 B 16 11 B 17 16 B 18 14 B 19 17 B 20 17 B 21 19 B 22 21 B 23 7 B 24 13 B > bartlett.test(count~spray,data=data) Bartlett test of homogeneity of variances data: count by spray Bartlett‘s K-squared = 0.10464, df = 1, p-value = 0.7463 ##p值是条件A和条件B的方差齐性的概率
以上是关于数据的正态分布验证和方差齐性检验的主要内容,如果未能解决你的问题,请参考以下文章
R语言使用比例-位置图(Scale-Location Plot)和Breusch-Pagan检验验证回归模型残差的同方差性(方差齐性)
R语言manova函数多元方差分析(MANOVA)单因素多元方差分析的两个假设是多元正态性和方差-协方差矩阵的齐性QQ图评估多元正态性mvoutlier包中的aq.plot函数检验多变量异常值