r包emmeans中的weights="cell"和weights="proportional"有啥区别
Posted
技术标签:
【中文标题】r包emmeans中的weights="cell"和weights="proportional"有啥区别【英文标题】:what is the difference between weights="cell" and weights="proportional" in r package emmeansr包emmeans中的weights="cell"和weights="proportional"有什么区别 【发布时间】:2021-06-19 05:51:00 【问题描述】:我想计算具有离散预测变量和不平衡数据的glm
模型中的边际均值。使用emmeans
包的函数emmeans
来获得边际均值给了我设置weights="cell"
和weights="proportional"
的不同结果。包文档说"proportional"
使用与被平均的因子组合的频率(在原始数据中)成比例的权重,"cells"
根据被平均的单元格的频率使用权重。但我不明白它的真正含义是什么?!请在下面查看我的 r 代码的简化版本!
如有任何帮助,我将不胜感激。
model <- glm(formula=y~x1+x2, data=df, family=gaussian)
library(emmeans)
marginal_means_cells <- summary(emmeans(model, "x1", weights="cells"))
marginal_means_prop <- summary(emmeans(model, "x1", weights="prop"))
【问题讨论】:
【参考方案1】:这将在 emmeans 包中的 "messy data" vignette 中进一步讨论。假设在 2 因子设计中,您的单元格频率如下:
Treatment
Dose | A B C | sum
------------------------------
a | 5 0 3 | 8
b | 11 3 9 | 23
------------------------------
sum | 16 3 12 | 31
然后使用“prop”权重,Treatment 的边际均值将全部使用权重 8 和 23 计算,Dose 的边际均值将全部使用权重 16、3 和 12 计算。
使用“细胞”权重,计算治疗的边际均值,其中 A 的权重为 5 和 11,B 的权重为 0 和 3,C 的权重为 3 和 9;并且 Dose 的边际均值通过 a 的权重 5、0、3 和 b 的权重 11、3、9 计算。
如果模型包含Treatment:Dose
交互作用,则甚至无法估计具有 0 个观察值的单元格,因此使用“prop”权重,治疗 B 或剂量 a 的边际均值也不能。但是这些边际均值可以用“细胞”权重来估计。
【讨论】:
感谢您的回答!我在模型中没有任何交互,但有许多频率为 0 的单元格。我认为估计边际均值的最佳方法是“道具”权重,对吧? 很难说最适合您的情况。也许您需要与顾问交谈。默认是等权重,我认为你应该考虑一下。以上是关于r包emmeans中的weights="cell"和weights="proportional"有啥区别的主要内容,如果未能解决你的问题,请参考以下文章
如何在 R 中的 emmeans() 命令中评估字符串变量作为因子?