为多个变量制作堆积条形图 - R 中的 ggplot2

Posted

技术标签:

【中文标题】为多个变量制作堆积条形图 - R 中的 ggplot2【英文标题】:Making a stacked bar plot for multiple variables - ggplot2 in R 【发布时间】:2011-10-05 07:33:39 【问题描述】:

我在 ggplot2 中制作堆叠条形图时遇到了一些问题。我知道如何用 barplot() 制作一个,但我想使用 ggplot2,因为很容易使条形图具有相同的高度(如果我没记错的话,使用 'position = 'fill'')。

我的问题是我有多个变量要相互叠加;我的数据如下所示:

dfr <- data.frame(
  V1 = c(0.1, 0.2, 0.3),
  V2 = c(0.2, 0.3, 0.2),
  V3 = c(0.3, 0.6, 0.5),
  V4 = c(0.5, 0.1, 0.7),
  row.names = LETTERS[1:3]
)

我想要的是在 X 轴上包含类别 A、B 和 C 的图,并且对于每个类别,V1、V2、V3 和 V4 的值在 Y 轴上堆叠在一起。我见过的大多数图表只在 Y 轴上绘制一个变量,但我确信可以以某种方式做到这一点。

我怎么能用 ggplot2 做到这一点?谢谢!

【问题讨论】:

+1 用于添加示例数据。欢迎来到 SO。 如果您发现任何答案有帮助,请选择一个作为您接受的答案。 【参考方案1】:

你也可以这样做

library(tidyverse)
dfr %>% rownames_to_column("ID") %>% pivot_longer(!ID) %>%
  ggplot() +
  geom_col(aes(x = ID, y = value, fill = name), position = 'fill')

【讨论】:

【参考方案2】:

首先,一些数据操作。将类别添加为变量并将数据融合为长格式。

dfr$category <- row.names(dfr)
mdfr <- melt(dfr, id.vars = "category")

现在绘图,使用名为 variable 的变量来确定每个条的填充颜色。

library(scales)
(p <- ggplot(mdfr, aes(category, value, fill = variable)) +
    geom_bar(position = "fill", stat = "identity") +
    scale_y_continuous(labels = percent)
)

(编辑:代码更新为使用 scales 包,根据 ggplot2 v0.9 的要求。)

【讨论】:

@lselzer,伟大的思想都一样! IMO,下次,即使非常相似,您也应该毫不犹豫地发布您的答案。 非常感谢里奇!这对我有用。我有一个问题 - 如果我用 'p 它对我不起作用...我在 Continuous_scale(c("y", "ymin", "ymax", "yend", "yintercept", : 未使用的参数(s) (formatter = "percent") @RachitAgrawal,我认为您必须更新代码。使用 library(scales) 然后更改上面的代码: scale_y_continuous(labels=percent) 新的ggplot 语法显然需要geom_bar(position = "fill", stat = "identity") 【参考方案3】:

请原谅我提出了一个新的答案,而我真的只是想对@Richie 提供的漂亮解决方案添加评论。我没有发布 cmets 的最低要求,所以这是我的情况:

... + geom_bar(position="fill") 为我的绘图抛出了错误,我使用的是 ggplot2 版本 0.9.3.1。和 reshape2 而不是为熔化而 reshape。

error_message:
*Mapping a variable to y and also using stat="bin".
  With stat="bin", it will attempt to set the y value to the count of cases in each group.
  This can result in unexpected behavior and will not be allowed in a future version of ggplot2.
  If you want y to represent counts of cases, use stat="bin" and don't map a variable to y.
  If you want y to represent values in the data, use stat="identity".
  See ?geom_bar for examples. (Deprecated; last used in version 0.9.2)
stat_bin: binwidth defaulted to range/30. Use 'binwidth = x' to adjust this.
Error in pmin(y, 0) : object 'y' not found*

所以我把它改成了geom_bar(stat='identity'),它就可以工作了。

【讨论】:

感谢您发布此错误,我不知道如何解决此错误!

以上是关于为多个变量制作堆积条形图 - R 中的 ggplot2的主要内容,如果未能解决你的问题,请参考以下文章

使用 ggplot2 制作堆积条形图

R 具有两个因子变量的堆积百分比条形图 - 如何在图中标记百分比,而不计算 NA?

具有 50 多个创建的虚拟变量的堆积条形图(百分比)? [关闭]

创建具有多个维度的堆积条形图

spss如何删除堆积条形图中的某块数据

带有 facet_grid 的 ggplot2 中具有多个分类变量的堆积条形图