带有逗号分隔的字符串条目的熊猫数据框,更改为唯一的逗号分隔的条目

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了带有逗号分隔的字符串条目的熊猫数据框,更改为唯一的逗号分隔的条目相关的知识,希望对你有一定的参考价值。

我有这样一个熊猫数据框:

import pandas as pd
data = [["a,a,a", "b,b", "c,c,c"], ["d,d","e","fd"],["g,h,i", "g", "fg,h,a"]]
df = pd.DataFrame(data, columns = ["ColA","ColB","ColC"])

df

    ColA    ColB    ColC
0   a,a,a   b,b     c,c,c
1   d,d     e       fd
2   g,h,i   g       fg,h,a

我想将此表重新格式化为:

    colA    colB    colC  
0   a       b       c
1   d       e       fd
2   g,h,i   g       fg,h,a

因此字符串按逗号分隔值分割每个条目后的唯一条目。

答案
df.applymap(lambda elements: ','.join(set(elements.split(','))))

以上是关于带有逗号分隔的字符串条目的熊猫数据框,更改为唯一的逗号分隔的条目的主要内容,如果未能解决你的问题,请参考以下文章

在熊猫中将数据类型从对象更改为字符串

将逗号分隔字符串的熊猫列转换为虚拟变量

如何将熊猫数据框中的嵌套逗号分隔列转换为Python中的特定格式

熊猫计算唯一值并更改为百分比并放入绘图条形图中

将 GST 编号字段的小数分隔符更改为逗号

熊猫数据框列有带逗号的字符串如何将其转换为列表[关闭]