为多个变量制作堆积条形图 - R 中的 ggplot2
Posted
技术标签:
【中文标题】为多个变量制作堆积条形图 - R 中的 ggplot2【英文标题】:Making a stacked bar plot for multiple variables - ggplot2 in R 【发布时间】:2011-10-05 07:33:39 【问题描述】:我在 ggplot2 中制作堆叠条形图时遇到了一些问题。我知道如何用 barplot() 制作一个,但我想使用 ggplot2,因为很容易使条形图具有相同的高度(如果我没记错的话,使用 'position = 'fill'')。
我的问题是我有多个变量要相互叠加;我的数据如下所示:
dfr <- data.frame(
V1 = c(0.1, 0.2, 0.3),
V2 = c(0.2, 0.3, 0.2),
V3 = c(0.3, 0.6, 0.5),
V4 = c(0.5, 0.1, 0.7),
row.names = LETTERS[1:3]
)
我想要的是在 X 轴上包含类别 A、B 和 C 的图,并且对于每个类别,V1、V2、V3 和 V4 的值在 Y 轴上堆叠在一起。我见过的大多数图表只在 Y 轴上绘制一个变量,但我确信可以以某种方式做到这一点。
我怎么能用 ggplot2 做到这一点?谢谢!
【问题讨论】:
+1 用于添加示例数据。欢迎来到 SO。 如果您发现任何答案有帮助,请选择一个作为您接受的答案。 【参考方案1】:你也可以这样做
library(tidyverse)
dfr %>% rownames_to_column("ID") %>% pivot_longer(!ID) %>%
ggplot() +
geom_col(aes(x = ID, y = value, fill = name), position = 'fill')
【讨论】:
【参考方案2】:首先,一些数据操作。将类别添加为变量并将数据融合为长格式。
dfr$category <- row.names(dfr)
mdfr <- melt(dfr, id.vars = "category")
现在绘图,使用名为 variable
的变量来确定每个条的填充颜色。
library(scales)
(p <- ggplot(mdfr, aes(category, value, fill = variable)) +
geom_bar(position = "fill", stat = "identity") +
scale_y_continuous(labels = percent)
)
(编辑:代码更新为使用 scales
包,根据 ggplot2 v0.9 的要求。)
【讨论】:
@lselzer,伟大的思想都一样! IMO,下次,即使非常相似,您也应该毫不犹豫地发布您的答案。 非常感谢里奇!这对我有用。我有一个问题 - 如果我用 'p 它对我不起作用...我在 Continuous_scale(c("y", "ymin", "ymax", "yend", "yintercept", : 未使用的参数(s) (formatter = "percent") @RachitAgrawal,我认为您必须更新代码。使用 library(scales) 然后更改上面的代码: scale_y_continuous(labels=percent) 新的ggplot
语法显然需要geom_bar(position = "fill", stat = "identity")
【参考方案3】:
请原谅我提出了一个新的答案,而我真的只是想对@Richie 提供的漂亮解决方案添加评论。我没有发布 cmets 的最低要求,所以这是我的情况:
... + geom_bar(position="fill")
为我的绘图抛出了错误,我使用的是 ggplot2 版本 0.9.3.1。和 reshape2 而不是为熔化而 reshape。
error_message:
*Mapping a variable to y and also using stat="bin".
With stat="bin", it will attempt to set the y value to the count of cases in each group.
This can result in unexpected behavior and will not be allowed in a future version of ggplot2.
If you want y to represent counts of cases, use stat="bin" and don't map a variable to y.
If you want y to represent values in the data, use stat="identity".
See ?geom_bar for examples. (Deprecated; last used in version 0.9.2)
stat_bin: binwidth defaulted to range/30. Use 'binwidth = x' to adjust this.
Error in pmin(y, 0) : object 'y' not found*
所以我把它改成了geom_bar(stat='identity')
,它就可以工作了。
【讨论】:
感谢您发布此错误,我不知道如何解决此错误!以上是关于为多个变量制作堆积条形图 - R 中的 ggplot2的主要内容,如果未能解决你的问题,请参考以下文章
R 具有两个因子变量的堆积百分比条形图 - 如何在图中标记百分比,而不计算 NA?