r包emmeans中的weights="cell"和weights="proportional"有啥区别

Posted

技术标签:

【中文标题】r包emmeans中的weights="cell"和weights="proportional"有啥区别【英文标题】:what is the difference between weights="cell" and weights="proportional" in r package emmeansr包emmeans中的weights="cell"和weights="proportional"有什么区别 【发布时间】:2021-06-19 05:51:00 【问题描述】:

我想计算具有离散预测变量和不平衡数据的glm 模型中的边际均值。使用emmeans 包的函数emmeans 来获得边际均值给了我设置weights="cell"weights="proportional" 的不同结果。包文档说"proportional" 使用与被平均的因子组合的频率(在原始数据中)成比例的权重,"cells" 根据被平均的单元格的频率使用权重。但我不明白它的真正含义是什么?!请在下面查看我的 r 代码的简化版本! 如有任何帮助,我将不胜感激。

model <- glm(formula=y~x1+x2, data=df, family=gaussian)
library(emmeans)
marginal_means_cells <- summary(emmeans(model, "x1", weights="cells"))
marginal_means_prop  <- summary(emmeans(model, "x1", weights="prop"))

【问题讨论】:

【参考方案1】:

这将在 emmeans 包中的 "messy data" vignette 中进一步讨论。假设在 2 因子设计中,您的单元格频率如下:

             Treatment
   Dose  |  A    B    C   |  sum
   ------------------------------
     a   |  5    0    3   |    8
     b   | 11    3    9   |   23
   ------------------------------
    sum  | 16    3   12   |   31

然后使用“prop”权重,Treatment 的边际均值将全部使用权重 8 和 23 计算,Dose 的边际均值将全部使用权重 16、3 和 12 计算。

使用“细胞”权重,计算治疗的边际均值,其中 A 的权重为 5 和 11,B 的权重为 0 和 3,C 的权重为 3 和 9;并且 Dose 的边际均值通过 a 的权重 5、0、3 和 b 的权重 11、3、9 计算。

如果模型包含Treatment:Dose 交互作用,则甚至无法估计具有 0 个观察值的单元格,因此使用“prop”权重,治疗 B 或剂量 a 的边际均值也不能。但是这些边际均值可以用“细胞”权重来估计。

【讨论】:

感谢您的回答!我在模型中没有任何交互,但有许多频率为 0 的单元格。我认为估计边际均值的最佳方法是“道具”权重,对吧? 很难说最适合您的情况。也许您需要与顾问交谈。默认是等权重,我认为你应该考虑一下。

以上是关于r包emmeans中的weights="cell"和weights="proportional"有啥区别的主要内容,如果未能解决你的问题,请参考以下文章

从 R 中的 emmeans 中删除一个对比

如何在 R 中的 emmeans() 命令中评估字符串变量作为因子?

无法通过 R 中的 emmeans 对比截距

为 R 中的许多列运行具有 emmeans 和对比的 LM

R中使用emmeans和geepack的每组边际均值和置信水平

运行 emmeans 的问题(assign '.Last.ref_grid' 中的错误)