如何计算 R 中两个数据集的显着差异?

Posted

技术标签:

【中文标题】如何计算 R 中两个数据集的显着差异?【英文标题】:How to compute the significant difference in two dataset in R? 【发布时间】:2021-06-15 12:15:21 【问题描述】:

我有两个数字向量,每个向量显示我们需要执行不同任务的天数:a 使用新技术与 b 使用旧技术

a

b

我需要知道 a 和 b 之间是否存在显着差异?如果是,估计两组之间的差异幅度?

【问题讨论】:

【参考方案1】:

如果你的值是正态分布的,你可以使用 R 的内置 t.test 函数。如果不是,您可以使用wilcox.test 函数(不假设人口的分布方式)。

您可能可以将差异幅度计算为倍数变化。

t.test(a,b)
wilcox.test(a,b)

foldChange = mean(a)/mean(b)

【讨论】:

非常感谢您的回复,您认为配对 t 检验在我的示例中是否合适? 如果来自 a 和 b 的各个值以某种方式连接,则将应用配对 t 检验,例如a 和 b 的第一个值来自同一个样本,a 和 b 的第二个值来自另一个样本,依此类推【参考方案2】:

假设样本组 a 和 b 均来自正态分布,您可以使用如下所示的双样本 t 检验来定义和检验两组均值是否存在显着差异。

注意,知道两个总体的方差是否相等会有所帮助,但这也在 t.test 函数的参数中得到解决:

t.test(a, b, alternative="two.lateral", var.equal=FALSE, conf.level=0.95)

【讨论】:

以上是关于如何计算 R 中两个数据集的显着差异?的主要内容,如果未能解决你的问题,请参考以下文章

matlab如何测试测量值之间的显着差异?

R中ACF和PACF的显着性水平

使用 dplyr 计算分组数据中相关性的显着性

如何制作带有字母的方差分析表以表示 R->latex 的组显着差异?

数组与数组列表的显着差异? [复制]

您如何测试回归估计参数(拟合数据)的显着性?