用均值填充缺失值

Posted 雾恋过往

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用均值填充缺失值相关的知识,希望对你有一定的参考价值。

        假设数据已经通过如下代码读进来了

import pandas as pd

titanic_data = pd.read_csv(\'titanic_data.csv\',encoding = \'gbk\')

        均值填充

for column in list(titanic_data.columns[titanic_data.isnull().sum() > 0]):
    mean_val = titanic_data[column].mean()
    titanic_data[column].fillna(mean_val, inplace=True)

        pandas (sum、mean、max、min、idxmax、idxmin、cumsum、mad、std、var、diff、pct_change、corr)这些函数会默认排除NaN值
        通过指定 skipna=False ,可以使其包含 Nan

以上是关于用均值填充缺失值的主要内容,如果未能解决你的问题,请参考以下文章

在pyspark中用平均值填充缺失值

python 特征缺失值填充

机器学习数据预处理之缺失值:均值填充

如何使用组均值填充 df 中的 nan 值?

熊猫:在每组中按平均值填充缺失值

熊猫:在每组中按平均值填充缺失值