箱线图:标记异常值

Posted

技术标签:

【中文标题】箱线图:标记异常值【英文标题】:Boxplot: label an outlier 【发布时间】:2021-11-06 10:36:12 【问题描述】:

我正在使用空气质量数据集,我在另一篇文章中看到了这一点。我想打印 3 个异常值的观察值而不是这些点的值,有没有办法做到这一点?我的意思是,我想要的是在这 3 个异常值的 Wind 向量中打印索引,而不是它们的值。谢谢

library(datasets)
library(ggplot2)
a=boxplot(airquality$Wind,plot=FALSE)
qplot(y=airquality$Wind,geom='boxplot')+
annotate(geom="text",x=rep(0.1,length(a$out)),
y=a$out,label=a$out,size=2.5)

【问题讨论】:

如何定义异常值?您是在使用箱线图的内部逻辑还是其他什么? 箱线图标准。我知道我可以通过 out1 【参考方案1】:

不知道您所说的很好地打印值是什么意思;这是一个印有观察指数的图;您可以使用注释参数调整外观。

library(datasets)
library(ggplot2)

a = boxplot(airquality$Wind, plot = FALSE)

qplot(y = airquality$Wind, geom = 'boxplot') +
  annotate(geom = "text",
           x = rep(0.1, length(a$out)),
           y = a$out,
           label = which(airquality$Wind  %in%  a$out),
           size = 2.5)

由reprex package (v2.0.0) 于 2021-09-09 创建

【讨论】:

非常感谢,“nicely”的意思是如果异常值非常接近,可能对应的观测值会重叠,难以辨认

以上是关于箱线图:标记异常值的主要内容,如果未能解决你的问题,请参考以下文章

关R语言实战中箱线图关于异常值理解的问题

没有异常值的 Matplotlib 箱线图

有箱线图,想用值标记中值和胡须

在指定分位数后添加箱线图异常值

箱线图法详解及matplotlib画箱线图以及boxplot参数详解

如何看箱线图??