简单稳健估计法——原理与 Python 实现

Posted zhuo木鸟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了简单稳健估计法——原理与 Python 实现相关的知识,希望对你有一定的参考价值。


本文主要参考 ISO 13528 C.2 条款。

设样本为 x 1 , x 2 , ⋯   , x n x_1, x_2, \\cdots, x_n x1,x2,,xn

均值估计

中位数

将样本 x 1 , x 2 , ⋯   , x n x_1, x_2, \\cdots, x_n x1,x2,,xn 按升序进行排序,可得: x { 1 } , x { 2 } , ⋯   , x { n } x_\\{1\\}, x_\\{2\\}, \\cdots, x_\\{n\\} x{1},x{2},,x{n}

则中位数为:
med ( x i ) = { x { n / 2 } + x { n / 2 + 1 } 2 n 是偶数 x { n + 1 2 } n 是奇数 \\text{med}(x_i) =\\left\\{\\begin{array}{c} \\frac{x_\\{n/2\\} + x_\\{n/2+1\\}}{2} & n \\text{是偶数} \\\\ x_\\{\\frac{n+1}{2}\\} & n \\text{是奇数} \\end{array}\\right. med(xi)={2x{n/2}+x{n/2+1}x{2n+1}n是偶数n是奇数

样本均值

x ˉ = ∑ i = 1 n x i n \\bar{x} = \\frac{\\sum_{i=1}^{n} x_i }{n} xˉ=ni=1nxi

稳健标准差

MADe

M A D e = 1.483 × med ( ∣ x i − med ( x i ) ∣ ) MADe = 1.483 \\times \\text{med} ( |x_i - \\text{med}(x_i)| ) MADe=1.483×med(ximed(xi))

nIQR

首先找出 x 1 , x 2 , ⋯   , x n x_1, x_2, \\cdots, x_n x1,x2,,xn 的上四分位数,和下四分位数,记为 Q3、Q1。前者是使得数据有 1/4 大于(或有可能等于) Q3,其余小于(或有可能等于)Q3 的数据有 3/4 。

Q3 和 Q1 的计算方式为:如果能够直接找到四分位数,则直接取;若找不到,则使用下述公式进行插值:
Q = x j + x i − x j fraction Q = x_j + \\frac{x_i - x_j} {\\text{fraction}} Q=xj+fractionxixj
其中, fraction \\text{fraction} fraction 为大于 Q 的数据数。比如 Q3 时为 fraction = 1 / 4 \\text{fraction} = 1/4 fraction=1/4, Q1 为 fraction = 3 / 4 \\text{fraction} = 3/4 fraction=3/4 x i , x j x_i, x_j xi,xj 为接近 Q 位置前后两个数 x i , x j x_i, x_j xi,xj,其中 x i > x j x_i > x_j xi>xj

例如 [ 1 , 2 , 3 , 4 ] [1,2,3,4] [1,2,3,4] 的 Q1 为 1.75,Q3 为 3.25。当然,也可以考虑其他插值方法,如去 x i , x j x_i, x_j xi,xj 的中位数,或取最接近 四分位数 的 x x x

于是 nIQR 为:
nIQR = 0.7413 × ( Q 3 − Q 1 ) \\text{nIQR} = 0.7413 \\times (Q3-Q1) nIQR=0.7413×(Q3Q1)

以上是关于简单稳健估计法——原理与 Python 实现的主要内容,如果未能解决你的问题,请参考以下文章

自主抽样法进行稳健估计——原理与 Python 实现

自主抽样法进行稳健估计——原理与 Python 实现

Trimmed 稳健均值估计与 中位数-中位数配对偏差法估计标准差——理论与 Python 实现

Trimmed 稳健均值估计与 中位数-中位数配对偏差法估计标准差——理论与 Python 实现

数据的核密度估计及其可视化:Python实现

数据的核密度估计及其可视化:Python实现