单因素方差分析与均匀性检验
Posted zhuo木鸟
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了单因素方差分析与均匀性检验相关的知识,希望对你有一定的参考价值。
ANOVA 均匀性检验代码展示
单因子方差分析
为了调查 1.5 V 3 号干电池的寿命是否由于生产工具的不同而不同,将每个厂的产品各取 5 个,测定其寿命,结果如下:
生产工厂 | 寿命 | 寿命 | 寿命 | 寿命 | 寿命 |
---|---|---|---|---|---|
A1 | 24.7 | 24.3 | 21.6 | 19.3 | 20.3 |
A2 | 30.8 | 19.0 | 18.8 | 29.7 | 25.1 |
A3 | 17.9 | 30.4 | 34.9 | 34.1 | 15.9 |
A4 | 23.1 | 33.0 | 23.0 | 25.4 | 18.1 |
A5 | 25.2 | 37.5 | 31.6 | 26.8 | 27.5 |
对于同一个工厂生产的电池来说,他的寿命是一个随机变量。由于同一个工厂生产出来的产品大致相当,误差应服从正态分布,故随机变量也服从正态分布,即 X ∼ N ( μ , σ 2 ) X\\sim N(\\mu,\\sigma^2) X∼N(μ,σ2)。所以,对于 A 1 ∼ A 5 A1\\sim A5 A1∼A5 来说,他们的产品都服从正态分布 X i ∼ N ( μ i , σ 2 ) X_i\\sim N(\\mu_i, \\sigma^2) Xi∼N(μi,σ2)。但有一个重要前提,是他们的方差要相同,否则无法进行单因素方差分析。
单因素方差分析的原假设为 H 0 : μ 1 = μ 2 = ⋯ = μ n H_0:\\mu_1=\\mu_2=\\cdots=\\mu_n H0:μ1=μ2=⋯=μn,其中 n n n 为工厂的数量。一般地,我们将影响因素成为因子或因素(factor),就本例而言,影响因素是工厂“类型”。
所以,单因素方差分析,就是为了判断类别型的自变量,对某个数量型的因变量有无影响的判断,且原假设是倾向于没有影响。
为了判断原假设,需要制定检验统计量。若原假设成立,我们有理由认为,每个样品,无论其生产工厂是谁,它们与其样本均值相差都不会太大,即:
S
s
=
∑
(
x
i
j
−
x
ˉ
)
2
S_s=\\sum(x_{ij}-\\bar{x})^2
Ss=∑(xij−xˉ)2
其中
x
i
j
x_{ij}
xij 是第
i
,
i
∈
{
1
,
2
,
⋯
,
n
}
i, i\\in\\{1,2,\\cdots,n\\}
i,i∈{1,2,⋯,n} 家工厂生产的第
j
,
j
∈
{
1
,
2
,
⋯
,
n
i
}
j, j\\in\\{1,2,\\cdots,n_i\\}
j,j∈{1,2,⋯,ni} 个样品。
x
ˉ
\\bar{x}
xˉ 是所有样品的均值:
x
ˉ
=
∑
i
n
∑
j
n
i
x
i
j
/
∑
i
n
n
i
\\bar{x}=\\sum_i^n\\sum_j^{n_i} x_{ij} /\\sum_i^n n_i
xˉ=i∑nj∑nixij/i∑nni
由于
S
s
S_s
Ss 从统计学的角度,无法找出一个合适的分布,但考虑到:
S
s
=
∑
i
n
∑
j
n
i
(
x
i
j
−
x
ˉ
)
2
=
∑
i
n
∑
j
n
i
(
x
ˉ
i
−
x
ˉ
)
2
+
∑
i
n
∑
j
n
i
(
x
i
j
−
x
ˉ
i
)
2
\\begin{aligned} S_s&=\\sum_i^n\\sum_j^{n_i}(x_{ij}-\\bar{x})^2 \\\\ &=\\sum_i^n\\sum_j^{n_i}(\\bar{x}_i-\\bar{x})^2 + \\sum_i^n\\sum_j^{n_i}(x_{ij}-\\bar{x}_{i})^2 \\end{aligned}
Ss=i∑nj∑ni(xij−xˉ)2=i∑nj∑ni(xˉi−xˉ)2+i∑nj∑ni(xij−xˉi)2
仔细观察上式,会发现第一项是属于同一个工厂的产品与其均值的差别,是同一个工厂(因素)的方差,我们可以称之为组内方差;第二项是每一个工厂的均值,与总均值之间的差别,是不同工厂的方差,我们称之为组间误差。于是我们可以把上式改写为:
S
s
=
S
S
1
+
S
S
2
S_s = SS_1 + SS_2
Ss=SS1+SS2
而我们知道,若不同厂家生产出来的产品如果没有显著差异,那么式:
S
S
1
S
S
2
\\frac{SS_1}{SS_2}
SS2SS1
应该比较小。也即组间方差,比组内方差会比较小。
但是 S S 1 S S 2 \\frac{SS_1}{SS_2} SS2SS1 似乎没有一个特定的分布。但我们知道 S S 1 SS_1 SS1 在 X i ∼ N ( μ i , σ 2 ) X_i\\sim N(\\mu_i, \\sigma^2) Xi∼N(μi,σ2) 时,满足 S S 1 ∼ χ 2 ( n − 1 ) SS_1\\sim \\chi^2(n-1) SS1∼χ2(n−1)。令
以上是关于单因素方差分析与均匀性检验的主要内容,如果未能解决你的问题,请参考以下文章