为啥在计算 z 分数时将样本标准差除以 sqrt(样本大小)

Posted

技术标签:

【中文标题】为啥在计算 z 分数时将样本标准差除以 sqrt(样本大小)【英文标题】:why divide sample standard deviation by sqrt(sample size) when calculating z-score为什么在计算 z 分数时将样本标准差除以 sqrt(样本大小) 【发布时间】:2018-07-11 06:30:29 【问题描述】:

我一直在关注可汗学院的视频以了解假设检验,我必须承认,到目前为止我的所有理解都是基于该来源。 现在,以下视频讨论了 z 分数/假设检验:

Hypothesis Testing

Z-statistic vs T-statistic

现在,我的疑问是关于 z 分数中的分母:

    对于 z 分数公式,即:z = (x – μ) / σ, 当总体的标准偏差 (σ) 已知时,我们直接使用它。 但是当它未知时,我们使用抽样分布, 那么我们有 z = (x – μ) / (σ / √n);我们用 σs 估计 σ;其中σs是样本的标准差,n是样本大小。

那么 z 得分 = (x – μ) / (σs / √n)。当 σs 已知时,为什么要除以 √n? 即使在视频中,假设检验 - Sal 也将样本的标准差除以 √n。直接给出σs,我们为什么要这样做?

请帮助我理解。

    我尝试将此应用于以下问题,但遇到以下问题:

问题:Yardley 设计了新香水。 Yardley 公司声称,平均新 香水瓶可以使用 300 天。另一家公司随机抽取35个新香水瓶 亚德利进行测试。采样瓶的平均使用时间为 190 天,其中 50天的标准差。如果亚德利的说法是真的, 35 个随机选择的瓶子的平均概率是多少 寿命不超过 190 天?

所以,上面的问题,当我执行以下操作时:

z = (190-300)/(50/√35),我们得到 z = -13.05,这不是一个可能的分数,因为 z 分数应该在 +-3 之间。

当我这样做时,z = (190-110)/50,或者更确切地说是 z = (x – μ) / σ,我似乎在这里得到了一个可以接受的答案。

请帮我弄清楚我错过了什么。

【问题讨论】:

您可能会在stats.stackexchange.com获得更多答案 【参考方案1】:

我认为 1/\sqrtn 的起源仅仅是计算单个瓶子寿命的标准偏差,还是一组瓶子的(样本)平均值的标准偏差。

问题表明 50 天是 35 瓶一组的寿命的标准差。这意味着估计的平均年龄(190 天)将有大约 50/\sqrt35 天的误差范围。假设这一类似的误差范围适用于声称的 300 天使用寿命,则可以使用互补误差函数计算出一组 35 瓶瓶子的使用寿命为 190 天或更短的概率。

您的 z=-13.05 看起来很正确,这意味着声称的 300 天寿命与 35 瓶实验中看到的一致是极不可能的。

【讨论】:

以上是关于为啥在计算 z 分数时将样本标准差除以 sqrt(样本大小)的主要内容,如果未能解决你的问题,请参考以下文章

方差、标准差、协方差、有啥区别?

如何理解皮尔逊相关系数

Z-分数(Z-score)是

为什么样本标准差要除以n-1?

什么是Z-score?都有哪些使用场景?

C#基础_C#计算样本标准差和总体标准差