R语言移除缺失值 NA

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言移除缺失值 NA相关的知识,希望对你有一定的参考价值。


有三种方法  !is.na  , na.omit, complete.cases

> d <- read.table("GWAS_s2.qassoc", header=T, stringsAsFactors=F)  

// 文件行数
> nrow(d)
[1] 431493

> d1 <- subset(d, select=c("CHR", "SNP", "BP", "P"))  

// 计算非NA 的行数

> num.bool <- complete.cases(d1)
> head(num.bool)
[1] FALSE  TRUE  TRUE FALSE  TRUE  TRUE  

> sum(num.bool) 
[1] 363836                                                                                                            
                                                                                                                            
> dn1 <- d1[which(!is.na(d1$P)),]                                                                                                                                                 
> nrow(dn1)                                                                                                                                                                       
[1] 363836

> dn2 <- na.omit(d1)
> nrow(dn2)                                                                                                                                                            
[1] 363836

> dn3 <-d1[complete.cases(d1[,4]),]                                                                                                                                               
> nrow(dn3)                                                                                                                                                                      
[1] 363836


> dn4 <-d1[complete.cases(d1),]                                                                                                                                                  
> nrow(dn4)
[1] 363836


方法三和方法四, 一个是根据第四列是否为NA判断的, 一个是根据所有列。

本文出自 “R和Python应用” 博客,请务必保留此出处http://matrix6ro.blog.51cto.com/1746429/1890622

以上是关于R语言移除缺失值 NA的主要内容,如果未能解决你的问题,请参考以下文章

R语言缺失值替换:缺失的值(NA)替换每个分组最近的非缺失值

R语言-缺失值判断以及处理

R语言使用isna函数查看列表和dataframe中是否包含缺失值将dataframe中数据列中的异常值标注为缺失值NA使用na.omit函数删除dataframe中包含缺失值NA的数据行

R语言自定义函数计算dataframe每列中的缺失值NA的个数缺失值问题及其填充示例

R语言dataframe(data.table)使用用最近的前一个非NA值向前填充缺失值NA实战

R语言dataframe数据列中的缺失值NA的个数统计实战:特定数据列的NA值统计所有特征的NA值统计