从熊猫数据框中的地址中删除分数

Posted

技术标签:

【中文标题】从熊猫数据框中的地址中删除分数【英文标题】:Remove fraction from an address in pandas data frame 【发布时间】:2018-11-10 16:00:06 【问题描述】:

我在 pandas 中有一个数据框,我想从带有地址的列中删除分数。我无法找出正确的回归实现来删除它们。

示例地址如下所示:

580 1/4 Broadway Street

85 1/4 Grand Street

两件事,我不知道如何遍历数据框来删除特殊字符。

还有两个什么是正确的正则表达式函数以及如何重新组合标志?

我想出了

"^(.)\d+/\d+\s(.)" 和 "\1\2" 将标志组合在一起

或者有没有更好的方法来做到这一点?

【问题讨论】:

【参考方案1】:

使用str.replace,你根本不需要匹配组。

df.address.str.replace(r'\d+\/\d+', '')

0    580  Broadway Street
1        85  Grand Street
Name: address, dtype: object

【讨论】:

非常感谢。我正用头撞墙试图弄清楚这一点。完美运行。 其实最后一个问题,replace(r'\d+\/\d+', '') 在# 和街道名称之间留下 2 个空格。如何删除 1 个空格? df.address.str.replace(r'\d+\/\d+\s', ''),尽管使用df.address.str.replace(r'\d+\/\d+\s?', '') 可能更安全

以上是关于从熊猫数据框中的地址中删除分数的主要内容,如果未能解决你的问题,请参考以下文章

如何从熊猫数据框中的时间戳列中删除时区

从熊猫数据框中的日期时间中删除时间戳

如何从熊猫数据框中的字符串项中删除数字

如何从熊猫数据框中的列中删除字符串值

如何使用正则表达式从熊猫数据框中的一行中的字符串中提取所有特定值?

我正在尝试使用熊猫删除重复的连续元素并保留数据框中的最后一个值