如何用pandas将某列进行唯一编码后,修改原dataframe

Posted K同学啊

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何用pandas将某列进行唯一编码后,修改原dataframe相关的知识,希望对你有一定的参考价值。

要用 Pandas 将某列进行唯一编码并修改原 DataFrame,可以使用 Pandas 中的 factorize() 函数和 DataFrame 的列操作方法。假设要将 DataFrame 中的 col 列进行唯一编码,代码如下:

python# 导入 Pandas 库
import pandas as pd

# 创建一个 DataFrame
df = pd.DataFrame(
    'col': ['A', 'B', 'C', 'A', 'C', 'B']
)

# 对 col 列进行唯一编码
df['col'], _ = pd.factorize(df['col'])

# 查看结果
print(df)

解释一下上面的代码:

  • pd.factorize(df['col']) 会返回 col 列进行唯一编码后的结果和编码映射表。因为我们只需要编码后的结果,所以用 _ 丢弃了编码映射表。
  • df['col'], _ = pd.factorize(df['col']) 将编码结果覆盖原 DataFrame 中的 col 列。
  • 最后,打印出来的 df 就是编码后的结果。

这样,就可以对原 DataFrame 进行修改了。

以上是关于如何用pandas将某列进行唯一编码后,修改原dataframe的主要内容,如果未能解决你的问题,请参考以下文章

如何用series更新dataframe某列数据

如何用两个字符串生成一个唯一的数字

oracle数据库如何用update批量更新某列数据中的字段

oracle数据库如何用update批量更新某列数据中的字段

在LINUX中如何用命令将某文件夹权限设定为777?

如何用mysql设计表