可视化缺失值的办法——R语言

Posted grayling

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了可视化缺失值的办法——R语言相关的知识,希望对你有一定的参考价值。

在数据分析中,对缺失值的处理是很关键一步,一般用summary()函数

a<-c(1,2,3,NA)
B<-c("a","b","c","D")
d<-data.frame(a,B)

summary(d)
      a       B    
 Min.   :1.0   a:1  
 1st Qu.:1.5   b:1  
 Median :2.0   c:1  
 Mean   :2.0   D:1  
 3rd Qu.:2.5        
 Max.   :3.0        
 NAs   :1 

但通过R语言的VIM包的aggr函数可以做缺失值的图形化展示:

library(VIM)

a<-c(1,2,3,NA)
B<-c("a","b",NA,NA)
d<-data.frame(A,B)
aggr(d, prop = F, numbers = T) 

 

技术图片

 

以上是关于可视化缺失值的办法——R语言的主要内容,如果未能解决你的问题,请参考以下文章

R语言ggplot2可视化:计算dataframe中每个数据列缺失值的个数使用堆叠的条形图(Stacked Barplot)可视化每个数据列的缺失值的情况(自定义堆叠条形图的形式)

R语言ggplot2可视化:使用堆叠的条形图(Stacked Barplot)可视化每个数据行(row)的缺失值的情况(Visualizing missing data counts in rows)

R语言ggplot2可视化:去除可视化结果中的NA图例删除缺失值图例

R语言ggplot2可视化线图(line plot):当数据有中断缺失时R不会将数据绘制为连续的线图而是出现断点

R语言ggplot2可视化:使用pracma包的interp1函数对缺失值进行线性插值后进行可视化分析用虚线标记进行数据填充的区域

ML之R:通过数据预处理(缺失值/异常值/特殊值的处理/长尾转正态分布/目标log变换/柱形图-箱形图-小提琴图可视化/构造特征/特征筛选)利用算法实现二手汽车产品交易价格回归预测之详细攻略