使用 ggplot2 将平均值添加到 R 中的分组箱形图
Posted
技术标签:
【中文标题】使用 ggplot2 将平均值添加到 R 中的分组箱形图【英文标题】:Add mean to grouped box plot in R with ggplot2 【发布时间】:2021-02-20 05:54:09 【问题描述】:我用 ggplot2 在 R 中创建了一个分组箱线图。但是,当我想添加平均值时,点会出现在组中的两个框之间。如何更改它以使每个框内都有点?
这是我的代码:
ggplot(results, aes(x=treatment, y=effect, fill=sex)) +
geom_boxplot() +
stat_summary(fun.y=mean, geom="point", shape=20, size=3, color="red")`
【问题讨论】:
【参考方案1】:您可以使用position_dodge2
。由于点和箱线图的宽度不同,您需要使用 width
参数反复试验以集中点。
ggplot(mtcars, aes(x=factor(gear), y=hp, fill=factor(vs))) +
geom_boxplot() +
stat_summary(fun.y=mean, geom="point", shape=20, size=3, color="red",
position = position_dodge2(width = 0.75,
preserve = "single"))
【讨论】:
【参考方案2】:在大多数情况下,您将无法将点放置在每个分组框中,因为它们通过轴相互重叠。一种替代方法是使用facet_wrap
。
这里是iris
数据的一个例子:
ggplot(iris, aes(x=Sepal.Length, y=Sepal.Width, fill=Species)) +
geom_point(aes(color = Species), shape = 20, size = 3) +
geom_boxplot(alpha = 0.8) +
facet_wrap(~Species)
如果您不希望点的颜色与箱线图的颜色相同,则必须从 geom_point
内的 aes
中删除分组变量。同样,以iris
为例,
ggplot(iris, aes(x=Sepal.Length, y=Sepal.Width, fill=Species)) +
geom_boxplot(alpha = 0.8) +
geom_point(shape = 20, size = 3, color = 'red') +
facet_wrap(~Species)
请注意,ggplot2
包是分层工作的。因此,如果在geom_boxplot
图层之后添加geom_point
图层,这些点将位于箱线图的顶部。如果在geom_boxplot
图层之前添加geom_point
图层,则这些点将在背景中。
编辑: 如果您想要在箱线图中添加一个点来表示平均值,您可以执行以下操作:
iris %>%
group_by(Species) %>%
mutate(mean.y = mean(Sepal.Width),
mean.x = mean(Sepal.Length)) %>%
ggplot(aes(x=Sepal.Length, y=Sepal.Width, fill=Species)) +
geom_boxplot(alpha = 0.8) +
geom_point(aes(y = mean.y, x = mean.x), shape = 20, size = 3, color = 'red')
但请注意,它可能需要在 x
轴上进行一些校准,以使其恰好位于每个框的中间。
【讨论】:
以上是关于使用 ggplot2 将平均值添加到 R 中的分组箱形图的主要内容,如果未能解决你的问题,请参考以下文章
R语言使用ggplot2包使用geom_dotplot函数绘制分组点图(手动编码添加均值标准偏差)实战(dot plot)
R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(添加均值标准偏差)实战
R语言使用ggplot2包使用geom_density()函数绘制分组密度图(线条色彩添加均值线)实战(density plot)
R语言使用ggplot2包使用geom_density()函数绘制分组密度图(填充色配置半透明填充色添加均值线)实战(density plot)
R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(编写自定义函数添加均值标准偏差)实战
R语言ggplot2可视化:自定义函数在箱图(boxplot)上添加分组样本个数(count)分组均值(mean)箱体填充色自定义数据标签色彩自定义