将文本标签添加到 ggplot2 马赛克图

Posted

技术标签:

【中文标题】将文本标签添加到 ggplot2 马赛克图【英文标题】:Add text labels to a ggplot2 mosaic plot 【发布时间】:2018-06-11 00:47:06 【问题描述】:

使用以下数据:

Category <- c("Bankpass", "Bankpass", "Bankpass", "Moving", "Moving")
Subcategory <- c("Stolen", "Lost", "Login", "Address", "New contract")
Weight <- c(10,20,13,40,20)
Duration <- as.character(c(0.2,0.4,0.5,0.44,0.66))
Silence <- as.character(c(0.1,0.3,0.25,0.74,0.26))
df <- data.frame(Category, Subcategory, Weight, Duration, Silence)

我用它来创建以下马赛克图:

library (ggplot2)
library (ggmosaic)

g <- ggplot(data = df) +
  geom_mosaic(aes(weight = Weight, x = product(Category), fill = Duration), 
              offset = 0, na.rm = TRUE) +  
  theme(axis.text.x = element_text(angle = -25, hjust = .1)) +
  theme(axis.title.x = element_blank()) +
  scale_fill_manual(values = c("#e8f5e9", "#c8e6c9", "#a5d6a7", "#81c784", "#66bb6a"))

这可行,但是我想在图表上的元素上包含文本标签(“显示 fe 被盗、丢失”等)

但是,当我这样做时:

g + geom_text(x = Category, y = Subcategory, label = Weight)

我收到以下错误:

UseMethod("rescale") 中的错误:没有适用的“rescale”方法应用于“character”类的对象

对这里出了什么问题有什么想法吗?

【问题讨论】:

【参考方案1】:

这是我的尝试。 x 轴位于离散变量(即类别)中。所以你不能在geom_text() 中使用它。您需要以某种方式为轴创建一个数值变量。同样,您需要在 y 轴上找到标签的位置。为了获得二维的数值,我决定访问图形后面的数据框。当您使用ggmosaic 包时,在这种情况下,图形后面有一个数据框。您可以使用ggplot_build() 获取它。您可以使用数据框中的信息(例如 xmin 和 xmax)计算 x 和 y 值。这是个好消息。但是,我们也有坏消息。当您访问数据时,您会意识到没有标签所需的有关子类别的信息。

我们可以克服将上述数据框与原始数据连接起来的挑战。当我加入数据时,我计算了原始数据和其他数据的比例。这些值被故意转换为字符。 temp 是添加标签所需的数据集。

library(dplyr)
library(ggplot2)
library(ggmosaic)

# Add proportion for each and convert to character for join

df <- group_by(df, Category) %>%
      mutate(prop = as.character(round(Weight / sum(Weight),3)))

# Add proportion for each and convert to character.
# Get x and y values for positions
# Use prop for join

temp <- ggplot_build(g)$data %>%
        as.data.frame %>%
        transmute(prop = as.character(round(ymax - ymin, 3)),
                  x.position = (xmax + xmin) / 2,
                  y.position = (ymax + ymin) / 2) %>%
        right_join(df)

g + geom_text(x = temp$x.position, y = temp$y.position, label = temp$Subcategory) 

【讨论】:

【参考方案2】:

我认为您正在寻找类似的东西

library(ggplot2)
library(ggmosaic)

您的数据:

Category <- c("Bankpass", "Bankpass", "Bankpass", "Moving", "Moving")
Subcategory <- c("Stolen", "Lost", "Login", "Address", "New contract")
Weight <- c(10,20,13,40,20)
Duration <- as.character(c(0.2,0.4,0.5,0.44,0.66))
Silence <- as.character(c(0.1,0.3,0.25,0.74,0.26))
mydf <- data.frame(Category, Subcategory, Weight, Duration, Silence)

ggplot(data = mydf) +
    geom_mosaic(aes( x = product(Duration, Subcategory), fill=factor(Duration)), na.rm=TRUE) + 
    theme(axis.text.x=element_text(angle=-25, hjust= .1)) +
    labs(x="Subcategory", title='f(Duration, Subcategory | Category)')  + 
    facet_grid(Category~.) + 
    guides(fill=guide_legend(title = "Duration", reverse = TRUE))

输出是:

这几乎是你在 ggmosaic 包上能做的最好的事情。您应该尝试其他软件包。

祝你的项目工作好运 ;-)

【讨论】:

还有哪些包? @Scipione Sarlo 你能告诉我你在这里提到的其他一些包吗? vcd,例如,或图形(参见:datasciencemadesimple.com/mosaic-plot-in-r)

以上是关于将文本标签添加到 ggplot2 马赛克图的主要内容,如果未能解决你的问题,请参考以下文章

将几万张图片合成一张图片,制作一个超赞的马赛克图

使用 R 创建“艺术”马赛克图片(*不是*统计马赛克图)

R语言可视化两个以上的分类(类别)变量之间的关系使用vcd包中的Mosaic函数创建马赛克图( Mosaic plots)分别可视化两个三个四个分类变量的关系的马赛克图

R语言 马赛克图

使用python画出马赛克图

如何制作 20 个数据帧的马赛克图并将它们放在 r 中的一页中?