如何用pandas将某列one-hot编码后,修改原dataframe
Posted K同学啊
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何用pandas将某列one-hot编码后,修改原dataframe相关的知识,希望对你有一定的参考价值。
要用Pandas将某列进行 one-hot 编码并修改原 DataFrame,可以使用 Pandas 中的 get_dummies()
函数和 DataFrame 的列操作方法。假设要将 DataFrame 中的 col
列进行 one-hot 编码,代码如下:
python# 导入 Pandas 库
import pandas as pd
# 创建一个 DataFrame
df = pd.DataFrame(
'col': ['A', 'B', 'C', 'A', 'C', 'B']
)
# 对 col 列进行 one-hot 编码
one_hot = pd.get_dummies(df['col'])
# 将 one-hot 编码后的结果与原 DataFrame 进行合并
df = pd.concat([df, one_hot], axis=1)
# 删除原始的 col 列
df = df.drop('col', axis=1)
解释一下上面的代码:
pd.get_dummies(df['col'])
会返回col
列进行 one-hot 编码后的结果。pd.concat([df, one_hot], axis=1)
会将one_hot
和原 DataFrame 按列方向进行合并。df.drop('col', axis=1)
会删除原始的col
列。
这样,就可以对原 DataFrame 进行修改了。
以上是关于如何用pandas将某列one-hot编码后,修改原dataframe的主要内容,如果未能解决你的问题,请参考以下文章
oracle数据库如何用update批量更新某列数据中的字段
oracle数据库如何用update批量更新某列数据中的字段