如何用pandas将某列进行唯一编码后,修改原dataframe
Posted K同学啊
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何用pandas将某列进行唯一编码后,修改原dataframe相关的知识,希望对你有一定的参考价值。
要用 Pandas 将某列进行唯一编码并修改原 DataFrame,可以使用 Pandas 中的 factorize()
函数和 DataFrame 的列操作方法。假设要将 DataFrame 中的 col
列进行唯一编码,代码如下:
python# 导入 Pandas 库
import pandas as pd
# 创建一个 DataFrame
df = pd.DataFrame(
'col': ['A', 'B', 'C', 'A', 'C', 'B']
)
# 对 col 列进行唯一编码
df['col'], _ = pd.factorize(df['col'])
# 查看结果
print(df)
解释一下上面的代码:
pd.factorize(df['col'])
会返回col
列进行唯一编码后的结果和编码映射表。因为我们只需要编码后的结果,所以用_
丢弃了编码映射表。df['col'], _ = pd.factorize(df['col'])
将编码结果覆盖原 DataFrame 中的col
列。- 最后,打印出来的
df
就是编码后的结果。
这样,就可以对原 DataFrame 进行修改了。
以上是关于如何用pandas将某列进行唯一编码后,修改原dataframe的主要内容,如果未能解决你的问题,请参考以下文章
oracle数据库如何用update批量更新某列数据中的字段