稳健估计的可靠性分析
Posted zhuo木鸟
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了稳健估计的可靠性分析相关的知识,希望对你有一定的参考价值。
文章目录
参考文献: Robust estimation in very small samples
本文将用 SEIF(Styled Empirical Influence Function)和 Breakdown Value 评估各种,对均值、方差的平方根的稳健估计方法的可靠性。
前提
本篇博客主要讨论两个估计量:
- 均值( μ \\mu μ),我们用样本去估计,记为 T n ( x 1 , x 2 , ⋯ , x n ) T_n(x_1,x_2,\\cdots,x_n) Tn(x1,x2,⋯,xn),简记为 T n ( X ) T_n(X) Tn(X)
- 方差的平方根(
σ
\\sigma
σ),我们用样本去估计,记为
S
n
(
x
1
,
x
2
,
⋯
,
x
n
)
S_n(x_1,x_2,\\cdots,x_n)
Sn(x1,x2,⋯,xn),简记为
S
n
(
X
)
S_n(X)
Sn(X)
其中 n n n 为样本容量,当然,在计算 S n S_n Sn 和 T n T_n Tn 的时候, μ , σ \\mu, \\sigma μ,σ 都是未知的。
我们讨论的稳健估计必须满足下述条件:
T
n
(
a
X
+
b
)
=
a
T
n
(
X
)
+
b
S
n
(
a
X
+
b
)
=
∣
a
∣
S
n
(
X
)
\\begin{array}{l} T_{n}(a X+b)=a T_{n}(X)+b \\\\ S_{n}(a X+b)=|a| S_{n}(X) \\end{array}
Tn(aX+b)=aTn(X)+bSn(aX+b)=∣a∣Sn(X)
且
X
∼
i
.
i
.
d
X\\sim i.i.d
X∼i.i.d
另外,为了方便了理解,我们定义样本 x 1 , x 2 , ⋯ , x n x_1,x_2,\\cdots, x_{n} x1,x2,⋯,xn 的次序统计量为: x 1 : n , x 2 : n , ⋯ , x n − 1 : n , x n : n x_{1:n},x_{2:n},\\cdots, x_{n-1:n},x_{n:n} x1:n,x2:n,⋯,xn−1:n,xn:n
传统稳健方法评估
评估方法
我们用 SEIF 来评估稳健估计方法,其中 EIF 的定义如下:
EIF
(
x
)
=
T
n
(
x
1
,
x
2
,
⋯
,
x
n
−
1
,
x
)
\\textbf{EIF}(x) = T_n(x_1,x_2,\\cdots, x_{n-1}, x)
EIF(x)=Tn(x1,x2,⋯,xn−1,x)
其中
x
x
x 是未知数,
x
1
,
x
2
,
⋯
,
x
n
−
1
x_1,x_2,\\cdots, x_{n-1}
x1,x2,⋯,xn−1 是容量为
n
−
1
n-1
n−1 的样本。EIF 的估计原理是,
x
1
,
x
2
,
⋯
,
x
n
−
1
x_1,x_2,\\cdots, x_{n-1}
x1,x2,⋯,xn−1 是正常样本,不包含离群值,而
x
x
x 作为自变量,可以模拟离群值和非离群值,于是,就可以根据 EIF 和 x 的关系,或变化曲线,来判断稳健估计方法的效果。
但这个正常样本 x 1 , x 2 , ⋯ , x n − 1 x_1,x_2,\\cdots, x_{n-1} x1,x2,⋯,xn−1 该如何取呢?根据 T n ( a X + b ) = a T n ( X ) + b T_{n}(a X+b)=a T_{n}(X)+b Tn(aX+b)=aTn(X)+b 和 S n ( a X + b ) = ∣ a ∣ S n ( X ) S_{n}(a X+b)=|a| S_{n}(X) Sn(aX+b)=∣a∣Sn(X),我们可以用正态分布来代表所有类型的样本。
对于
x
1
,
x
2
,
⋯
,
x
n
−
1
x_1,x_2,\\cdots, x_{n-1}
x1,x2,⋯,xn−1 ,我们可以取正态分布的
m
m
m 分位数:
x
i
=
Φ
−
1
(
i
−
1
/
3
m
+
1
/
3
)
for
i
=
1
,
…
,
m
x_{i}=\\Phi^{-1}\\left(\\frac{i-1 / 3}{m+1 / 3}\\right) \\quad \\text { for } i=1, \\ldots, m
xi=Φ−1(m+1/3i−1/3) for i=1,…,m
其中
m
=
n
−
1
m=n-1
m=n−1。
于是,我们将样本 x 1 , x 2 , ⋯ , x n − 1 x_1,x_2,\\cdots, x_{n-1} x1,x2,⋯,x以上是关于稳健估计的可靠性分析的主要内容,如果未能解决你的问题,请参考以下文章