简单稳健估计法——原理与 Python 实现
Posted zhuo木鸟
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了简单稳健估计法——原理与 Python 实现相关的知识,希望对你有一定的参考价值。
本文主要参考 ISO 13528 C.2 条款。
设样本为 x 1 , x 2 , ⋯ , x n x_1, x_2, \\cdots, x_n x1,x2,⋯,xn。
均值估计
中位数
将样本 x 1 , x 2 , ⋯ , x n x_1, x_2, \\cdots, x_n x1,x2,⋯,xn 按升序进行排序,可得: x { 1 } , x { 2 } , ⋯ , x { n } x_\\{1\\}, x_\\{2\\}, \\cdots, x_\\{n\\} x{1},x{2},⋯,x{n}。
则中位数为:
med
(
x
i
)
=
{
x
{
n
/
2
}
+
x
{
n
/
2
+
1
}
2
n
是偶数
x
{
n
+
1
2
}
n
是奇数
\\text{med}(x_i) =\\left\\{\\begin{array}{c} \\frac{x_\\{n/2\\} + x_\\{n/2+1\\}}{2} & n \\text{是偶数} \\\\ x_\\{\\frac{n+1}{2}\\} & n \\text{是奇数} \\end{array}\\right.
med(xi)={2x{n/2}+x{n/2+1}x{2n+1}n是偶数n是奇数
样本均值
x ˉ = ∑ i = 1 n x i n \\bar{x} = \\frac{\\sum_{i=1}^{n} x_i }{n} xˉ=n∑i=1nxi
稳健标准差
MADe
M A D e = 1.483 × med ( ∣ x i − med ( x i ) ∣ ) MADe = 1.483 \\times \\text{med} ( |x_i - \\text{med}(x_i)| ) MADe=1.483×med(∣xi−med(xi)∣)
nIQR
首先找出 x 1 , x 2 , ⋯ , x n x_1, x_2, \\cdots, x_n x1,x2,⋯,xn 的上四分位数,和下四分位数,记为 Q3、Q1。前者是使得数据有 1/4 大于(或有可能等于) Q3,其余小于(或有可能等于)Q3 的数据有 3/4 。
Q3 和 Q1 的计算方式为:如果能够直接找到四分位数,则直接取;若找不到,则使用下述公式进行插值:
Q
=
x
j
+
x
i
−
x
j
fraction
Q = x_j + \\frac{x_i - x_j} {\\text{fraction}}
Q=xj+fractionxi−xj
其中,
fraction
\\text{fraction}
fraction 为大于 Q 的数据数。比如 Q3 时为
fraction
=
1
/
4
\\text{fraction} = 1/4
fraction=1/4, Q1 为
fraction
=
3
/
4
\\text{fraction} = 3/4
fraction=3/4。
x
i
,
x
j
x_i, x_j
xi,xj 为接近 Q 位置前后两个数
x
i
,
x
j
x_i, x_j
xi,xj,其中
x
i
>
x
j
x_i > x_j
xi>xj。
例如 [ 1 , 2 , 3 , 4 ] [1,2,3,4] [1,2,3,4] 的 Q1 为 1.75,Q3 为 3.25。当然,也可以考虑其他插值方法,如去 x i , x j x_i, x_j xi,xj 的中位数,或取最接近 四分位数 的 x x x。
于是 nIQR 为:
nIQR
=
0.7413
×
(
Q
3
−
Q
1
)
\\text{nIQR} = 0.7413 \\times (Q3-Q1)
nIQR=0.7413×(Q3−Q1)
以上是关于简单稳健估计法——原理与 Python 实现的主要内容,如果未能解决你的问题,请参考以下文章
Trimmed 稳健均值估计与 中位数-中位数配对偏差法估计标准差——理论与 Python 实现