Python 用于用均值估算缺失值,帮我试试这段代码,但出错了

Posted

技术标签:

【中文标题】Python 用于用均值估算缺失值,帮我试试这段代码,但出错了【英文标题】:Python for imputing missing values with mean, help me I try this code but error 【发布时间】:2021-09-20 17:24:39 【问题描述】:
df.loc[(data['Perkotaan'].isnull()==True),'Perkotaan']=df['Perkotaan'].mean()
df.loc[(data['Perdesaan'].isnull()==True),'Perdesaan']=df['Perdesaan'].mean()

KeyError Traceback(最近一次调用最后一次) /usr/local/lib/python3.7/dist-packages/pandas/core/indexes/base.py in get_loc(self,key,method,tolerance) 2897 尝试: -> 2898 返回 self._engine.get_loc(casted_key) 2899 除了 KeyError 错误:

pandas/_libs/index.pyx in pandas._libs.index.IndexEngine.get_loc()

pandas/_libs/index.pyx in pandas._libs.index.IndexEngine.get_loc()

pandas/_libs/hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item()

pandas/_libs/hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item()

KeyError: 'Perkotaan'

上述异常是以下异常的直接原因:

KeyError Traceback(最近一次调用最后一次) 2帧 /usr/local/lib/python3.7/dist-packages/pandas/core/indexes/base.py in get_loc(self,key,method,tolerance) 第2898章 2899 除了 KeyError 作为错误: -> 2900 从错误中引发 KeyError(key) 2901 2902 如果容差不是无:

KeyError: 'Perkotaan'

【问题讨论】:

【参考方案1】:

您的数据框分配给 df 或 data?

df.loc[(data['Perkotaan'].isnull()==True),'Perkotaan']=df['Perkotaan'].mean()

我认为您必须将其更改为 df 或仔细检查您选择的列。 “Perkotaan”不是您的数据框的一列。

【讨论】:

以上是关于Python 用于用均值估算缺失值,帮我试试这段代码,但出错了的主要内容,如果未能解决你的问题,请参考以下文章

在 R 中使用 ROLLING 平均值估算缺失值

Sklearn 或 Pandas,用简单的线性回归估算缺失值

Spark Imputer 归因估算器 补全缺失值

有没有办法在机器学习中估算缺失值?

在R语言中进行缺失值填充:估算缺失值

python 特征缺失值填充