2个数据集的标准偏差(每个都有标准偏差)

Posted

技术标签:

【中文标题】2个数据集的标准偏差(每个都有标准偏差)【英文标题】:Standard Deviation of 2 Datasets (Each Having Standard Deviation) 【发布时间】:2021-10-16 20:51:09 【问题描述】:

假设我有 2 个数据集(每个数据集都是一组值,每个都有一个标准偏差)。

我想找到两个数据集元素之间的平均差异,例如((element1_set1 - element1_set2) + (element2_set1 - element2_set2)) / 2 用于两个长度为 2 的数据集。

这是否意味着我必须逐元素添加标准差,然后找到它们的平均值以获得整体标准差?

还是只求数组的均值和标准差,[element1_set1 - element1_set2, element2_set1 - element2_set2]?

【问题讨论】:

【参考方案1】:

我真的不明白你为什么在其中混入标准差。

要获得均值差,您只需减去均值即可。 这是因为以下原因(假设 x 是第一个数据集的元素,y 是第二个数据集的元素):

但这不适用于标准差,因为有平方。

【讨论】:

感谢您的回复。我真的很困惑,好像有多个标准偏差,我们必须包括所有。但是,如果标准差是由同一类型的错误引起的,我们是否不必包括它们? 关于标准差我想说的是:创建包含差异的第三个数据集。取新数据集的标准差。我认为这是最好和最直接的方式。忽略您为数据集 1 和 2 计算的标准差。 我明白了,谢谢。那么你可以只使用最终数据集的标准,因为只有一个错误来源吗?如果有多个,您是否必须考虑每个单独集合的标准? 不,据我所见。差异数据集的标准偏差将包含两个数据集差异中存在的所有变化。

以上是关于2个数据集的标准偏差(每个都有标准偏差)的主要内容,如果未能解决你的问题,请参考以下文章

sas如何计算相邻观测的差值

标准偏差为零的归一化

删除高于/低于标准偏差的值

关于模型的评估

模型方差与偏差

具有自定义标准偏差的 Excel 图表