如何计算 R 中两个数据集的显着差异?
Posted
技术标签:
【中文标题】如何计算 R 中两个数据集的显着差异?【英文标题】:How to compute the significant difference in two dataset in R? 【发布时间】:2021-06-15 12:15:21 【问题描述】:我有两个数字向量,每个向量显示我们需要执行不同任务的天数:a 使用新技术与 b 使用旧技术
a
b
我需要知道 a 和 b 之间是否存在显着差异?如果是,估计两组之间的差异幅度?
【问题讨论】:
【参考方案1】:如果你的值是正态分布的,你可以使用 R 的内置 t.test
函数。如果不是,您可以使用wilcox.test
函数(不假设人口的分布方式)。
您可能可以将差异幅度计算为倍数变化。
t.test(a,b)
wilcox.test(a,b)
foldChange = mean(a)/mean(b)
【讨论】:
非常感谢您的回复,您认为配对 t 检验在我的示例中是否合适? 如果来自 a 和 b 的各个值以某种方式连接,则将应用配对 t 检验,例如a 和 b 的第一个值来自同一个样本,a 和 b 的第二个值来自另一个样本,依此类推【参考方案2】:假设样本组 a 和 b 均来自正态分布,您可以使用如下所示的双样本 t 检验来定义和检验两组均值是否存在显着差异。
注意,知道两个总体的方差是否相等会有所帮助,但这也在 t.test 函数的参数中得到解决:
t.test(a, b, alternative="two.lateral", var.equal=FALSE, conf.level=0.95)
【讨论】:
以上是关于如何计算 R 中两个数据集的显着差异?的主要内容,如果未能解决你的问题,请参考以下文章