使用KNN进行缺失值填补详解及实践

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用KNN进行缺失值填补详解及实践相关的知识,希望对你有一定的参考价值。

使用KNN进行缺失值填补详解及实践

使用KNN进行缺失值填补详解及实践

See the source image

 

数据缺失填充方式分为很多种:

删除法、均值法、回归法、KNN、MICE、EM等等。R语言包中在此方面比较全面,python稍差。

目前已有的两种常见的包有:

impyute、fancyimpute、sklearn等

 

sklearn的KNNImputer是一种广泛使用的缺失值插补方法。它被广泛认为是传统插补技术的替代品。

在当今世界,数据是从许多来源收集的,用于分析、产生见解、验证理论等等。从不同的资源收集的这些数据通常会丢失一些信息。这可能是由于数据收集或提取过程中的问题导致的,该问题可能是人为错误。

处理这些缺失值,成为数据预处理中的一个重要步骤。插补方法的选择至关重要,因为它会对工作产生重大影响。

 

# fancyimpute包方案:

import nu

以上是关于使用KNN进行缺失值填补详解及实践的主要内容,如果未能解决你的问题,请参考以下文章

标称变量(Categorical Features)或者分类变量(Categorical Features​​​​​​​)缺失值填补详解及实战

KNN(K Nearest Neighbors)分类是什么学习方法?如何或者最佳的K值?RadiusneighborsClassifer分类器又是什么?KNN进行分类详解及实践

缺失值处理拉格朗日插值法—随机森林算法填充—sklearn填充(均值/众数/中位数)

详解支持向量机-SVC真实数据案例:预测明天是否会下雨-填补缺失值和编码菜菜的sklearn课堂笔记

单元无回答的缺失数据处理方法

面经|缺失值填补的7种方法(使用场景+Python代码)