从熊猫数据框中的地址中删除分数
Posted
技术标签:
【中文标题】从熊猫数据框中的地址中删除分数【英文标题】:Remove fraction from an address in pandas data frame 【发布时间】:2018-11-10 16:00:06 【问题描述】:我在 pandas 中有一个数据框,我想从带有地址的列中删除分数。我无法找出正确的回归实现来删除它们。
示例地址如下所示:
580 1/4 Broadway Street
85 1/4 Grand Street
两件事,我不知道如何遍历数据框来删除特殊字符。
还有两个什么是正确的正则表达式函数以及如何重新组合标志?
我想出了
"^(.)\d+/\d+\s(.)" 和 "\1\2" 将标志组合在一起
或者有没有更好的方法来做到这一点?
【问题讨论】:
【参考方案1】:使用str.replace
,你根本不需要匹配组。
df.address.str.replace(r'\d+\/\d+', '')
0 580 Broadway Street
1 85 Grand Street
Name: address, dtype: object
【讨论】:
非常感谢。我正用头撞墙试图弄清楚这一点。完美运行。 其实最后一个问题,replace(r'\d+\/\d+', '') 在# 和街道名称之间留下 2 个空格。如何删除 1 个空格?df.address.str.replace(r'\d+\/\d+\s', '')
,尽管使用df.address.str.replace(r'\d+\/\d+\s?', '')
可能更安全以上是关于从熊猫数据框中的地址中删除分数的主要内容,如果未能解决你的问题,请参考以下文章