python 熊猫前处理:欠损値

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 熊猫前处理:欠损値相关的知识,希望对你有一定的参考价值。

from sklearn.preprocessing import Imputer

imp = Imputer(missing_values='NaN', strategy='mean')
imp.fit(df[['身長(cm)']])

values = imp.transform(df[['身長(cm)']])
df[['身長(cm)']] = values
df


#  欠測値(NaN) に対して 中央値(median) を割り当てるImputerオブジェクトを生成
imp = Imputer(missing_values="NaN", strategy="median")

# データセットの学習 + strategy="median"に基づいて欠測値(NaN)を中央値に置き換える
values = imp.fit_transform(df[["体重(kg)"]])

# DataFrameに変換したデータを代入する
df[["体重(kg)"]] = values
df

#  欠測値(NaN) に対して 最頻値(median) を割り当てるImputerオブジェクトを生成
imp = Imputer(missing_values="NaN", strategy="most_frequent")

# データセットの学習 + strategy="most_frequent"に基づいて欠測値(NaN)を中央値に置き換える
values = imp.fit_transform(df[["視力"]])

# DataFrameに変換したデータを代入する
df[["視力"]] = values
df

以上是关于python 熊猫前处理:欠损値的主要内容,如果未能解决你的问题,请参考以下文章

Python:在熊猫数据帧上使用多处理

python 大熊猫处理EXECL

优化内存使用 - 熊猫/ Python

熊猫数据处理

无法让熊猫打开 CSV [Python, Jupyter, Pandas]

兽化熊猫(Python)