python 熊猫前处理:欠损値
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 熊猫前处理:欠损値相关的知识,希望对你有一定的参考价值。
from sklearn.preprocessing import Imputer
imp = Imputer(missing_values='NaN', strategy='mean')
imp.fit(df[['身長(cm)']])
values = imp.transform(df[['身長(cm)']])
df[['身長(cm)']] = values
df
# 欠測値(NaN) に対して 中央値(median) を割り当てるImputerオブジェクトを生成
imp = Imputer(missing_values="NaN", strategy="median")
# データセットの学習 + strategy="median"に基づいて欠測値(NaN)を中央値に置き換える
values = imp.fit_transform(df[["体重(kg)"]])
# DataFrameに変換したデータを代入する
df[["体重(kg)"]] = values
df
# 欠測値(NaN) に対して 最頻値(median) を割り当てるImputerオブジェクトを生成
imp = Imputer(missing_values="NaN", strategy="most_frequent")
# データセットの学習 + strategy="most_frequent"に基づいて欠測値(NaN)を中央値に置き換える
values = imp.fit_transform(df[["視力"]])
# DataFrameに変換したデータを代入する
df[["視力"]] = values
df
以上是关于python 熊猫前处理:欠损値的主要内容,如果未能解决你的问题,请参考以下文章
Python:在熊猫数据帧上使用多处理
python 大熊猫处理EXECL
优化内存使用 - 熊猫/ Python
熊猫数据处理
无法让熊猫打开 CSV [Python, Jupyter, Pandas]
兽化熊猫(Python)