在pandas数据框中搜索并替换点和逗号

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在pandas数据框中搜索并替换点和逗号相关的知识,希望对你有一定的参考价值。

这是我的DataFrame:

d = {'col1': ['sku 1.1', 'sku 1.2', 'sku 1.3'], 'col2': ['9.876.543,21', 654, '321,01']}
df = pd.DataFrame(data=d)
df

       col1           col2
0   sku 1.1   9.876.543,21
1   sku 1.2            654
2   sku 1.3         321,01

col2中的数据是本地格式的数字,我想将其转换为:

      col2
9876543.21
       654
    321.01

我尝试了df['col2'] = pd.to_numeric(df['col2'], downcast='float'),它返回一个ValueError ::无法在位置0解析字符串“9.876.543,21”。

我也尝试了df = df.apply(lambda x: x.str.replace(',', '.')),它返回ValueError:无法将字符串转换为float:'5.023.654.​​46'

谢谢你的帮助!

答案

如果可能的参数在read_csv使用最好:

df = pd.read_csv(file, thousands='.', decimal=',')

如果不可能,那么replace应该帮助:

df['col2'] = (df['col2'].replace('.','', regex=True)
                        .replace(',','.', regex=True)
                        .astype(float))
另一答案

你可以试试

df = df.apply(lambda x: x.replace(',', '&'))
df = df.apply(lambda x: x.replace('.', ','))
df = df.apply(lambda x: x.replace('&', '.'))
另一答案

您最好使用存在的标准系统设施。知道某些语言环境使用逗号和小数点不同,我无法相信Pandas不会使用语言环境的格式。

当然,快速搜索显示this gist,它解释了如何利用locales将字符串转换为数字。本质上,您需要import locale,并且在构建数据框调用locale.setlocale以建立使用逗号作为小数点和分隔符的句点的区域设置之后,然后应用数据框的applymapp方法。

以上是关于在pandas数据框中搜索并替换点和逗号的主要内容,如果未能解决你的问题,请参考以下文章

如何在整个 Pandas 数据框中搜索字符串并获取包含它的列的名称?

如何替换 Pandas 数据框的字符串列中的文本?

在 Pandas 数据框中查找和替换子字符串忽略大小写

如何将 Pandas 数据框中的负数替换为零

python pandas用数字替换数据框中的字符串

用 pandas 中的 empty_rows 替换 pandas 数据框中的 NaN [重复]