如何计算 R 中两个数据集的显着差异？

Posted 2023-03-12

技术标签:

【中文标题】如何计算 R 中两个数据集的显着差异？【英文标题】：How to compute the significant difference in two dataset in R? 【发布时间】：2021-06-15 12:15:21 【问题描述】：

我有两个数字向量，每个向量显示我们需要执行不同任务的天数：a 使用新技术与 b 使用旧技术

a

b

我需要知道 a 和 b 之间是否存在显着差异？如果是，估计两组之间的差异幅度？

【问题讨论】：

【参考方案1】：

如果你的值是正态分布的，你可以使用 R 的内置 t.test 函数。如果不是，您可以使用wilcox.test 函数（不假设人口的分布方式）。

您可能可以将差异幅度计算为倍数变化。

t.test(a,b)
wilcox.test(a,b)

foldChange = mean(a)/mean(b)

【讨论】：

非常感谢您的回复，您认为配对 t 检验在我的示例中是否合适？如果来自 a 和 b 的各个值以某种方式连接，则将应用配对 t 检验，例如a 和 b 的第一个值来自同一个样本，a 和 b 的第二个值来自另一个样本，依此类推【参考方案2】：

假设样本组 a 和 b 均来自正态分布，您可以使用如下所示的双样本 t 检验来定义和检验两组均值是否存在显着差异。

注意，知道两个总体的方差是否相等会有所帮助，但这也在 t.test 函数的参数中得到解决：

t.test(a, b, alternative="two.lateral", var.equal=FALSE, conf.level=0.95)

【讨论】：

以上是关于如何计算 R 中两个数据集的显着差异？的主要内容，如果未能解决你的问题，请参考以下文章