R语言-均值填充缺失值

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言-均值填充缺失值相关的知识,希望对你有一定的参考价值。

参考技术A 在基因芯片数据或其他类型数据中,采用计算所有样本的平均值从而进行填充,如果需要用中位数或其他统计量填充时只需修改相应的方法即可

#1. 检查是否有缺失值

which(is.na(mRNA),arr.ind = T)

#2. 计算行均值并填充

#该数据中探针(基因)为行(名),样本为列(名),(数据框内容为表达量数据值型数据数据)格式可见文章最后

row_mean <- apply(mRNA,1,mean,na.rm =T) #1是行,2是列,若用其他方法修改mean即可

mRNA$MEAN <- row_mean

ncol = 样本数

for (i in 1:nrow(mRNA))

  mRNA[i,is.na(mRNA[i,])] <- mRNA[i,ncol]

R语言进行缺失值填充(Filling in missing values):使用R原生方法data.tabledplyr等方案

R语言进行缺失值填充(Filling in missing values):使用R原生方法、data.table、dplyr等方案

目录

R语言进行缺失值填充&#x

以上是关于R语言-均值填充缺失值的主要内容,如果未能解决你的问题,请参考以下文章

在R语言中进行缺失值填充:估算缺失值

R语言自定义函数计算dataframe每列中的缺失值NA的个数缺失值问题及其填充示例

R语言使用caret包的preProcess函数进行数据填充使用K近邻KNN算法进行缺失值填充

R语言vtreat包自动处理dataframe的缺失值并生成对应的数据列_isbad来指示数据的原始缺失情况查看特定字段缺失的那些数据行查看数据集中多个字段的均值

机器学习数据预处理之缺失值:均值填充

R语言进行缺失值填充(Filling in missing values):使用R原生方法data.tabledplyr等方案