如何在 ggplot2 散点图上覆盖 lm 对象的线

Posted

技术标签:

【中文标题】如何在 ggplot2 散点图上覆盖 lm 对象的线【英文标题】:How to overlay a line for an lm object on a ggplot2 scatterplot 【发布时间】:2010-12-01 08:42:31 【问题描述】:

我有一些数据,

calvarbyruno.1<-structure(list(Nominal = c(1, 3, 6, 10, 30, 50, 150, 250), Run = structure(c(1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L), .Label = c("1", "2", "3"), class = "factor"), 
    PAR = c(1.25000000000000e-05, 0.000960333333333333, 0.00205833333333334, 
    0.00423333333333333, 0.0322333333333334, 0.614433333333334, 
    1.24333333333333, 1.86333333333333), PredLin = c(-0.0119152187070942, 
    0.00375925114245899, 0.0272709559167888, 0.0586198956158952, 
    0.215364594111427, 0.372109292606959, 1.15583278508462, 1.93955627756228
    ), PredQuad = c(-0.0615895732702735, -0.0501563307416599, 
    -0.0330831368244257, -0.0104619953693943, 0.100190275883806, 
    0.20675348710041, 0.6782336426345, 1.04748729725370)), .Names = c("Nominal", 
"Run", "PAR", "PredLin", "PredQuad"), row.names = c(NA, 8L), class = "data.frame")
calweight <- -2

为此我创建了一个线性和二次 lm 模型

callin.1<-lm(PAR~Nominal,data=calvarbyruno.1,weight=Nominal^calweight)
calquad.1<-lm(PAR~Nominal+I(Nominal^2),data=calvarbyruno.1,weight=Nominal^calweight)

然后我可以使用 ggplot2 绘制我的数据值

qplot(PAR,Nominal,data=calvarbyruno.1)

但不知道如何覆盖代表两个 lm 对象的线...有什么想法吗?

【问题讨论】:

【参考方案1】:

之前我问了一个相关问题,哈德利有this good answer。使用该帖子中的预测功能,您可以向数据添加两列。每个模型一个:

calvarbyruno.1$calQuad <- predict(calquad.1)
calvarbyruno.1$callin <- predict(callin.1)

然后就是绘制点并将每个模型添加为一条线:

ggplot() + 
geom_point(data=calvarbyruno.1, aes(PAR, Nominal), colour="green") + 
geom_line(data=calvarbyruno.1, aes(calQuad, Nominal), colour="red" ) + 
geom_line(data=calvarbyruno.1, aes(callin, Nominal), colour="blue" ) + 
opts(aspect.ratio = 1)

这导致了这张漂亮的图片(是的,颜色可以使用一些工作):

(来源:cerebralmastication.com)

【讨论】:

【参考方案2】:

最简单的选择是使用 geom_smooth() 并让 ggplot2 为您拟合模型。

ggplot(calvarbyruno.1, aes(y = PAR, x = Nominal, weight=Nominal^calweight)) + 
    geom_smooth(method = "lm") + 
    geom_smooth(method = "lm", formula = y ~ poly(x, 2), colour = "red") + 
    geom_point() + 
    coord_flip()

或者您可以使用预测值创建一个新数据集。

newdata <- data.frame(Nominal = pretty(calvarbyruno.1$Nominal, 100))
newdata$Linear <- predict(callin.1, newdata = newdata)
newdata$Quadratic <- predict(calquad.1, newdata = newdata)
require(reshape2)
newdata <- melt(newdata, id.vars = "Nominal", variable.name = "Model")
ggplot(calvarbyruno.1, aes(x = PAR, y = Nominal, weight=Nominal^calweight)) + 
    geom_line(data = newdata, aes(x = value, colour = Model)) + 
    geom_point()

【讨论】:

Thierry,您介意张贴结果图片吗?谢谢!

以上是关于如何在 ggplot2 散点图上覆盖 lm 对象的线的主要内容,如果未能解决你的问题,请参考以下文章

R语言ggplot2可视化散点图(scatter plot)并在可视化图像的顶部和右边添加边缘直方图(Marginal Histogram)使用geom_smooth函数基于lm方法拟合数据点之间

R语言ggplot2可视化散点图(scatter plot)并在可视化图像的顶部和右边添加边缘箱图(Marginal boxplot)使用geom_smooth函数基于lm方法拟合数据点之间的趋势

R语言ggplot2可视化数据点重合的散点图数据点有重合使用geom_smooth函数基于lm方法拟合数据点之间的趋势关系曲线自定义数据点的大小色彩添加主标题副标题题注信息

R语言ggplot2可视化数据点重合的散点图数据点有重合使用geom_smooth函数基于lm方法拟合数据点之间的趋势关系曲线自定义数据点的大小色彩添加主标题副标题题注信息

尽管有两组使用 ggplot2,但散点图具有单条回归线

ggplot2将滚动平均值的标准差添加到散点图