geom_vline,图例和性能

Posted

技术标签:

【中文标题】geom_vline,图例和性能【英文标题】:geom_vline, legend and performance 【发布时间】:2019-07-21 03:14:33 【问题描述】:

我想在我的绘图上绘制几条垂直线,并为每个对应的 vline 绘制一个图例。

看完this post,下面是我实现的:

set.seed(99)
df.size <- 1e6
my.df <- data.frame(dist = rnorm(df.size, mean = 0, sd = 2))
library(ggplot2)
ggplot(my.df, aes(x=dist)) + geom_histogram(binwidth = 0.5)

vline1.threshold <- mean(my.df$dist)
vline2.threshold <- mean(my.df$dist) + 3*sd(my.df$dist)

现在开始剧情:

g <- ggplot(my.df, aes(x = dist)) +
  geom_histogram(binwidth = 0.5) +
  geom_vline(aes(color = "vline1", xintercept = vline1.threshold)) +
  geom_vline(aes(color = "vline2", xintercept = vline2.threshold)) +
  scale_color_manual("Threshold", values = c(vline1 = "red", vline2 = "blue"), labels = c("Mean", "Mean + 3*SD"))
system.time(print(g))

这很好用:

但是很慢:

utilisateur     système      écoulé 
     51.667       1.883      53.652 

(对不起,我的系统是法语的)

但是,当我这样做时(在 aes 之外使用 xintercept):

g <- ggplot(my.df, aes(x = dist)) +
  geom_histogram(binwidth = 0.5) +
  geom_vline(aes(color = "vline1"), xintercept = vline1.threshold, color = "red") +
  geom_vline(aes(color = "vline2"), xintercept = vline2.threshold, color = "blue") +
  scale_color_manual("Threshold", values = c(vline1 = "red", vline2 = "blue"), labels = c("Mean", "Mean + 3*SD"))
system.time(print(g))

图例不显示:

但它要快得多:

utilisateur     système      écoulé 
      1.193       0.270       1.496 

我怎样才能两全其美,即传奇,快速显示?

【问题讨论】:

【参考方案1】:

您可以使用第一种方法,但将空的 data.frame 作为 data 参数传递给 geom_vline。速度问题是由geom_vlinemy.df 中的每一行绘制线引起的,data = data.frame() 它只绘制一次。

g2 <- ggplot(my.df, aes(x = dist)) +
  geom_histogram(binwidth = 0.5) +
  # pass empty data.frame as data
  geom_vline(aes(color = "vline1", xintercept = vline1.threshold), data.frame()) +
  # pass empty data.frame as data
  geom_vline(aes(color = "vline2", xintercept = vline2.threshold), data.frame()) +
  scale_color_manual("Threshold", values = c(vline1 = "red", vline2 = "blue"), labels = c("Mean", "Mean + 3*SD"))

# OPs solution
# system.time(print(g))
#   user  system elapsed 
# 36.636   1.714  38.397 

# data.frame() solution
# system.time(print(g2))
#   user  system elapsed 
#  2.203   0.265   2.504 

【讨论】:

正是这样的问题让我怀疑 ggplot 的架构是否存在深深的误导。

以上是关于geom_vline,图例和性能的主要内容,如果未能解决你的问题,请参考以下文章

带有 `geom_vline` 和 `geom_hline` 的 ggplot。任务:需要单独的图例

如何在同一个散点图上使用 geom_vline() 和 geom_hline 避免图例中的交叉效应?

R语言ggplot2可视化:为图像中的均值竖线中位数竖线 geom_vline添加图例(legend)

做双图例时如何添加条件语句

geom_vline,传奇和表演

图例与注记的区别是啥?~~~~~