将文本标签添加到 ggplot2 马赛克图
Posted
技术标签:
【中文标题】将文本标签添加到 ggplot2 马赛克图【英文标题】:Add text labels to a ggplot2 mosaic plot 【发布时间】:2018-06-11 00:47:06 【问题描述】:使用以下数据:
Category <- c("Bankpass", "Bankpass", "Bankpass", "Moving", "Moving")
Subcategory <- c("Stolen", "Lost", "Login", "Address", "New contract")
Weight <- c(10,20,13,40,20)
Duration <- as.character(c(0.2,0.4,0.5,0.44,0.66))
Silence <- as.character(c(0.1,0.3,0.25,0.74,0.26))
df <- data.frame(Category, Subcategory, Weight, Duration, Silence)
我用它来创建以下马赛克图:
library (ggplot2)
library (ggmosaic)
g <- ggplot(data = df) +
geom_mosaic(aes(weight = Weight, x = product(Category), fill = Duration),
offset = 0, na.rm = TRUE) +
theme(axis.text.x = element_text(angle = -25, hjust = .1)) +
theme(axis.title.x = element_blank()) +
scale_fill_manual(values = c("#e8f5e9", "#c8e6c9", "#a5d6a7", "#81c784", "#66bb6a"))
这可行,但是我想在图表上的元素上包含文本标签(“显示 fe 被盗、丢失”等)
但是,当我这样做时:
g + geom_text(x = Category, y = Subcategory, label = Weight)
我收到以下错误:
UseMethod("rescale") 中的错误:没有适用的“rescale”方法应用于“character”类的对象
对这里出了什么问题有什么想法吗?
【问题讨论】:
【参考方案1】:这是我的尝试。 x 轴位于离散变量(即类别)中。所以你不能在geom_text()
中使用它。您需要以某种方式为轴创建一个数值变量。同样,您需要在 y 轴上找到标签的位置。为了获得二维的数值,我决定访问图形后面的数据框。当您使用ggmosaic
包时,在这种情况下,图形后面有一个数据框。您可以使用ggplot_build()
获取它。您可以使用数据框中的信息(例如 xmin 和 xmax)计算 x 和 y 值。这是个好消息。但是,我们也有坏消息。当您访问数据时,您会意识到没有标签所需的有关子类别的信息。
我们可以克服将上述数据框与原始数据连接起来的挑战。当我加入数据时,我计算了原始数据和其他数据的比例。这些值被故意转换为字符。 temp
是添加标签所需的数据集。
library(dplyr)
library(ggplot2)
library(ggmosaic)
# Add proportion for each and convert to character for join
df <- group_by(df, Category) %>%
mutate(prop = as.character(round(Weight / sum(Weight),3)))
# Add proportion for each and convert to character.
# Get x and y values for positions
# Use prop for join
temp <- ggplot_build(g)$data %>%
as.data.frame %>%
transmute(prop = as.character(round(ymax - ymin, 3)),
x.position = (xmax + xmin) / 2,
y.position = (ymax + ymin) / 2) %>%
right_join(df)
g + geom_text(x = temp$x.position, y = temp$y.position, label = temp$Subcategory)
【讨论】:
【参考方案2】:我认为您正在寻找类似的东西
library(ggplot2)
library(ggmosaic)
您的数据:
Category <- c("Bankpass", "Bankpass", "Bankpass", "Moving", "Moving")
Subcategory <- c("Stolen", "Lost", "Login", "Address", "New contract")
Weight <- c(10,20,13,40,20)
Duration <- as.character(c(0.2,0.4,0.5,0.44,0.66))
Silence <- as.character(c(0.1,0.3,0.25,0.74,0.26))
mydf <- data.frame(Category, Subcategory, Weight, Duration, Silence)
ggplot(data = mydf) +
geom_mosaic(aes( x = product(Duration, Subcategory), fill=factor(Duration)), na.rm=TRUE) +
theme(axis.text.x=element_text(angle=-25, hjust= .1)) +
labs(x="Subcategory", title='f(Duration, Subcategory | Category)') +
facet_grid(Category~.) +
guides(fill=guide_legend(title = "Duration", reverse = TRUE))
输出是:
这几乎是你在 ggmosaic
包上能做的最好的事情。您应该尝试其他软件包。
祝你的项目工作好运 ;-)
【讨论】:
还有哪些包? @Scipione Sarlo 你能告诉我你在这里提到的其他一些包吗? vcd,例如,或图形(参见:datasciencemadesimple.com/mosaic-plot-in-r)以上是关于将文本标签添加到 ggplot2 马赛克图的主要内容,如果未能解决你的问题,请参考以下文章
R语言可视化两个以上的分类(类别)变量之间的关系使用vcd包中的Mosaic函数创建马赛克图( Mosaic plots)分别可视化两个三个四个分类变量的关系的马赛克图