两个数据集之间均值差的置信区间

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了两个数据集之间均值差的置信区间相关的知识,希望对你有一定的参考价值。

我正在研究两个数据集,这些数据集来自qazxsw hoi,一个内置的R数据集。

cats

我想找到男性和女性标本Bwt之间平均值差异的99%置信区间(性别== M和性别= = F)

我知道> cats Sex Bwt Hwt 1 F 2.0 7.0 2 F 2.0 7.4 3 F 2.0 9.5 4 F 2.1 7.2 5 F 2.1 7.3 6 F 2.1 7.6 7 F 2.1 8.1 8 F 2.1 8.2 9 F 2.1 8.3 10 F 2.1 8.5 11 F 2.1 8.7 12 F 2.1 9.8 ... 137 M 3.6 13.3 138 M 3.6 14.8 139 M 3.6 15.0 140 M 3.7 11.0 141 M 3.8 14.8 142 M 3.8 16.8 143 M 3.9 14.4 144 M 3.9 20.5 这样做,除其他外,但如果我将t.test分解为包含男性和女性的cats的两个数据集,t.test()抱怨这两个数据集的长度不同,这是真的。在Bwt只有47名女性,87名男性。

是否可以通过其他方式实现,还是通过分解数据来误解数据?

编辑:我有一个回答者在另一个问题上向我建议的函数,它可以获得数据集中的均值CI,可能会派上用场:

cats
答案

您应该使用公式接口应用t.test:

ci_func <- function(data, ALPHA){
  c(
    mean(data) - qnorm(1-ALPHA/2) * sd(data)/sqrt(length(data)),
    mean(data) + qnorm(1-ALPHA/2) * sd(data)/sqrt(length(data))
    )
}

以上是关于两个数据集之间均值差的置信区间的主要内容,如果未能解决你的问题,请参考以下文章

SPSS参数的区间估计

标准误,标准差,置信区间分不清?派森诺教你画误差线

均值的置信区间 - scipy 实现与数学公式不符

关于两个正态总体均值差μ1-μ2的置信区间

怎么用matlab计算一组数据的总体均值和标准差σ的95%置信区间

创建具有均值和置信区间的 ggplot