在 ggplot2 中创建密度直方图?
Posted
技术标签:
【中文标题】在 ggplot2 中创建密度直方图?【英文标题】:Creating a density histogram in ggplot2? 【发布时间】:2014-01-30 10:47:18 【问题描述】:我想用ggplot2
创建下一个直方图密度图。以“正常”方式(基础包)非常简单:
set.seed(46)
vector <- rnorm(500)
breaks <- quantile(vector,seq(0,1,by=0.1))
labels = 1:(length(breaks)-1)
den = density(vector)
hist(df$vector,
breaks=breaks,
col=rainbow(length(breaks)),
probability=TRUE)
lines(den)
到目前为止,使用 ggplot 我已经达到了这一点:
seg <- cut(vector,breaks,
labels=labels,
include.lowest = TRUE, right = TRUE)
df = data.frame(vector=vector,seg=seg)
ggplot(df) +
geom_histogram(breaks=breaks,
aes(x=vector,
y=..density..,
fill=seg)) +
geom_density(aes(x=vector,
y=..density..))
但是“y”比例尺的尺寸有误。我注意到下一次运行得到正确的“y”比例。
ggplot(df) +
geom_histogram(breaks=breaks,
aes(x=vector,
y=..density..,
fill=seg)) +
geom_density(aes(x=vector,
y=..density..))
我只是不明白。 y=..density..
在那里,应该是高度。那么,当我尝试填充它时,为什么我的比例会被修改呢?
我确实需要颜色。我只想要一个直方图,其中每个块的中断和颜色是根据默认的 ggplot 填充颜色定向设置的。
【问题讨论】:
我编辑了您提交的内容,以便代码适合页面。您可能对 Google 关于如何编码以获得最大可读性和实用性的建议感兴趣:请参阅 google-styleguide.googlecode.com/svn/trunk/Rguide.xml 【参考方案1】:我手动为您的百分位条添加了颜色。看看这是否适合你。
library(ggplot2)
ggplot(df, aes(x=vector)) +
geom_histogram(breaks=breaks,aes(y=..density..),colour="black",fill=c("red","orange","yellow","lightgreen","green","darkgreen","blue","darkblue","purple","pink")) +
geom_density(aes(y=..density..)) +
scale_x_continuous(breaks=c(-3,-2,-1,0,1,2,3)) +
ylab("Density") + xlab("df$vector") + ggtitle("Histogram of df$vector") +
theme_bw() + theme(plot.title=element_text(size=20),
axis.title.y=element_text(size = 16, vjust=+0.2),
axis.title.x=element_text(size = 16, vjust=-0.2),
axis.text.y=element_text(size = 14),
axis.text.x=element_text(size = 14),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())
【讨论】:
谢谢,我一直在寻找替代解决方案,但最终选择了您的解决方案。【参考方案2】:fill=seg
导致分组。对于seg
的每个值,您实际上得到了不同的直方图。如果你不需要颜色,你可以使用这个:
ggplot(df) +
geom_histogram(breaks=breaks,aes(x=vector,y=..density..), position="identity") +
geom_density(aes(x=vector,y=..density..))
如果您需要颜色,在 ggplot2 之外计算密度值可能是最简单的方法。
【讨论】:
对不起,我不明白你的评论。【参考方案3】:或者ggpubr
的选项
library(ggpubr)
gghistogram(df, x = "vector", add = "mean", rug = TRUE, fill = "seg",
palette = c("#00AFBB", "#E7B800", "#E5A800", "#00BFAB", "#01ADFA",
"#00FABA", "#00BEAF", "#01AEBF", "#00EABA", "#00EABB"), add_density = TRUE)
【讨论】:
【参考方案4】:关于解释 y-axis
的混淆可能是由于密度被绘制而不是计数。因此,y-axis
上的值是总样本的比例,其中 条形的总和等于 1
。
【讨论】:
以上是关于在 ggplot2 中创建密度直方图?的主要内容,如果未能解决你的问题,请参考以下文章
R语言与医学统计图形-14ggplot2几何对象之直方密度图
R语言使用ggplot2包使用geom_density()函数绘制分组密度图(添加直方图分组颜色配置)实战(density plot)