缺失值处理

Posted gouq

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了缺失值处理相关的知识,希望对你有一定的参考价值。

在日常的处理数据的时候,会遇到数据中某些地方没有值,也就是缺失了。

对于这种情况,一半有两种情况:删除和插补。

一般步建议删除。

技术图片

 

 API:sklearn.preprocessing.Imputer

技术图片

 

参数介绍:missing_value 表示缺失值是什么;strategy 表示填补的策略,是用均值还是中值等;axis表示按照行还是列填补。

注意:数据中的人缺失值必须为np.nan,不能为?或nan等。

可以用replace函数将缺失值转换为np.nan

 

上代码:

 1 from sklearn.preprocessing import StandardScaler,Imputer
 2 import numpy as np
 3 def im():
 4     ‘‘‘
 5     缺失值处理
 6     :return:
 7     ‘‘‘
 8     im=Imputer(missing_values=NaN, strategy=mean, axis=0)
 9     data = im.fit_transform([[90,2,10,40],[np.nan,4,15,45],[75,3,13,46]])
10     print(data)
11 if __name__ == __main__:
12     im()

技术图片

 

 

以上是关于缺失值处理的主要内容,如果未能解决你的问题,请参考以下文章

分析数据, 缺失值处理 ,去重处理, 噪音处理

处理逻辑回归的 NaN(缺失)值 - 最佳实践?

面经|缺失值填补的7种方法(使用场景+Python代码)

面经|缺失值填补的7种方法(使用场景+Python代码)

R语言之缺失值和异常值处理

2020-08-05--Pandas-03--缺失值处理