Dixon 检验法判断正态分布离群值——原理和 Python 实现
Posted zhuo木鸟
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Dixon 检验法判断正态分布离群值——原理和 Python 实现相关的知识,希望对你有一定的参考价值。
本文主要根据 GB/T 4883-2008 的 7.3 条款写成。
记样本为 x 1 , x 2 , ⋯ , x n x_1, x_2, \\cdots, x_n x1,x2,⋯,xn,n 为样本容量,按照升序排序,得到持续统计量为 x ( 1 ) , x ( 2 ) , ⋯ , x ( n ) x_{(1)}, x_{(2)}, \\cdots, x_{(n)} x(1),x(2),⋯,x(n)
Dixon 检验——单侧检验
原理步骤
Dixon 检验一般是根据可能离群值,和离它最接近的值的距离,以及整个样本的跨度,来判断该值是否为离群值。这些可能离群值,需要接收判断的值,有时候也叫歧离值。
Dixon 检验一般用在 [3,30] 时,比较有效。因此,本文主要讨论 [3, 30] 的情况。
Dixon 检验的检验统计量为(
D
n
D_n
Dn 为上侧检验时的统计量,
D
n
′
D_n^\\prime
Dn′ 为下侧检验时的统计量):
D
n
=
r
10
=
x
(
n
)
−
x
(
n
−
1
)
x
(
n
)
−
x
(
1
)
3
≤
n
≤
7
D
n
′
=
r
10
′
=
x
(
2
)
−
x
(
1
)
x
(
n
)
−
x
(
1
)
3
≤
n
≤
7
D
n
=
r
11
=
x
(
n
)
−
x
(
n
−
1
)
x
(
n
)
−
x
(
2
)
8
≤
n
≤
10
D
n
′
=
r
11
′
=
x
(
2
)
−
x
(
1
)
x
(
n
−
1
)
−
x
(
1
)
8
≤
n
≤
10
D
n
=
r
21
=
x
(
n
)
−
x
(
n
−
2
)
x
(
n
)
−
x
(
2
)
11
≤
n
≤
13
D
n
′
=
r
21
′
=
x
(
3
)
−
x
(
1
)
x
(
n
−
1
)
−
x
(
1
)
11
≤
n
≤
13
D
n
=
r
22
=
x
(
n
)
−
x
(
n
−
2
)
x
(
n
)
−
x
(
3
)
14
≤
n
≤
30
D
n
′
=
r
22
′
=
x
(
3
)
−
x
(
1
)
x
(
n
−
2
)
−
x
(
1
)
14
≤
n
≤
30
D_n = r_{10} = \\frac{x_{(n)} - x_{(n-1)}} {x_{(n)} - x_{(1)}} \\text{~~~~~~} 3 \\leq n \\leq 7 \\\\ \\text{ }\\\\ D_n^\\prime = r^\\prime_{10} = \\frac{x_{(2)} - x_{(1)}} {x_{(n)} - x_{(1)}} \\text{~~~~~~} 3 \\leq n \\leq 7 \\\\ \\text{ }\\\\ D_n = r_{11} = \\frac{x_{(n)} - x_{(n-1)}} {x_{(n)} - x_{(2)}} \\text{~~~~~~} 8 \\leq n \\leq10 \\\\ \\text{ } \\\\ D_n^\\prime = r^\\prime_{11} = \\frac{x_{(2)} - x_{(1)}} {x_{(n-1)} - x_{(1)}} \\text{~~~~~~} 8 \\leq n \\leq 10 \\\\ \\text{ }\\\\ D_n = r_{21} = \\frac{x_{(n)} - x_{(n-2)}} {x_{(n)} - x_{(2)}} \\text{~~~~~~} 11 \\leq n \\leq13 \\\\ \\text{ } \\\\ D_n^\\prime = r^\\prime_{21} = \\frac{x_{(3)} - x_{(1)}} {x_{(n-1)} - x_{(1)}} \\text{~~~~~~} 11 \\leq n \\leq 13 \\\\ \\text{ }\\\\ D_n = r_{22} = \\frac{x_{(n)} - x_{(n-2)}} {x_{(n)} - x_{(3)}} \\text{~~~~~~} 14 \\leq n \\leq30 \\\\ \\text{ } \\\\ D_n^\\prime = r^\\prime_{22} = \\frac{x_{(3)} - x_{(1)}} {x_{(n-2)} - x_{(1)}} \\text{~~~~~~} 14 \\leq n \\leq 30 \\\\
Dn=r10=x(n)−x(1)x(n)−x(n−1) 3≤n≤7 Dn′=r10′=x(n)−x(1)x(2)−x(1) 3≤n≤7 Dn=r11=x(n)−x(2)x(n)−x(n−1) 8≤n≤10 Dn′=r11′=x(n−1)−x(1)x(2)−x(1) 8≤n≤10 Dn=r21=x(n)−x(2)x(n)−x(n−2) 11≤n≤13 Dn′=r21′=x(n−1)−x(1)x(3)−x(1) 11≤n≤13 DGESD 离群值检验——理论与 Python 实现