统计量及其抽样分布

Posted 2022-08-11 zm-pop-pk

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了统计量及其抽样分布相关的知识，希望对你有一定的参考价值。

为了推断总体的某些特征，我们需要抽取若干个体，这一过程称为抽样，所抽取的这部分个体称为样本，样本中包含的个体数量称为样本量。但是抽样得到的样本是杂乱无章的，虽然包含了一部分总体的信息，却难以发掘出来。因此，需要对样本数据进行一定的处理（构造函数），算出一些具有代表性的、可以反映总体特征的数字，这样的数字就称为统计量。由于样本来自总体，因此总体的分布也决定了样本统计量的抽样分布。

所谓推断统计，就是从总体中抽取样本，构造适当的统计量，由样本特征去推断总体特征。

统计量

从总体抽取一个样本量为n的样本$(X_1,X_2,\cdots ,X_n)$后，为了将分散在样本中的信息集中起来，需要构造出不同的样本函数$T(X_1,X_2,\cdots ,X_n)$，称为统计量。显然，统计量这个概念完全脱胎于样本，它是关于样本的函数，并不依赖于总体的未知参数。

矩

由于统计量是人为构造的，所以它有无穷多种，但我们关心的是那些有意义的、能反应总体特征的统计量。我们把经验分布函数$F_n(x)$的各阶矩称为样本各阶矩，当n充分大时，经验分布函数$F_n(x)$非常靠近总体分布函数$F(X)$，因此样本各阶矩就反映了总体各阶矩的信息。

样本$k$阶矩、样本均值

$m_k=\frac1n\sum_i=1^nX_i^k$，称$m_k$为样本$k$阶矩，显然$m_1=\barX=\frac1n\sum_i=1^nX_i$，所以样本1阶矩即为样本均值。

样本$k$阶中心矩、样本方差

$\upsilon _k=\frac1n-1\sum_i=1^n(X_i-\barX)^k$，称$\upsilon _k$为样本$k$阶中心矩，显然，$\upsilon _2=S^2=\frac1n-1\sum_i=1^n(X_i-\barX)^2$，所以样本2阶中心矩即为样本方差。

样本变异系数

$V=\fracS\barX$称为样本变异系数，它反映总体变异系数$C=\frac\sqrtD(X)E(X)$的信息，它消除了均值对总体离散程度的影响，用于刻画不同均值的不同总体的离散程度。

充分统计量

我们用样本去推测总体时，所使用的“样本”实际上是样本统计量，也就是说这个统计量代表了样本中蕴含的信息。那么我们需要知道，该统计量可以胜任这个工作吗？它真的能够代表这个样本吗？我们将样本加工过程（构造统计量的过程）中，把样本中关于总体的信息一点都不损失地提取出来的统计量称为充分统计量。

从二项分布总体中抽取一个样本$(X_1,X_2,\cdots ,X_n)$，统计量$\sum_i=1^nX_i$是总体率$\pi$的充分统计量。

从正态分布总体中抽取一个样本$(X_1,X_2,\cdots ,X_n)$，若$\mu$已知，则$\sum_i=1^n(X_i-\mu)^2$是总体方差$\sigma ^2$的充分统计量，若$\sigma^2$已知，则$\barX=\frac1n\sum_i=1^nX_i$是$\mu$的充分统计量。

以上是关于统计量及其抽样分布的主要内容，如果未能解决你的问题，请参考以下文章

区间估计 | 抽样分布抽来看——bootstrap法

4. 抽样分布—卡方分布F分布t分布Beta分布Gamma分布——python实战

三大抽样分布：卡方分布，t分布和F分布的简单理解

如何使用真实模型编写一个循环来模拟 t 统计量在 null 下的抽样分布？

[概率论与数理统计]笔记：4.4 抽样分布

怎样估计样本量的大小？