从字符串中提取带逗号的数字
Posted
技术标签:
【中文标题】从字符串中提取带逗号的数字【英文标题】:Extracting Numbers with Commas from String 【发布时间】:2019-12-13 11:49:00 【问题描述】:我想从房屋描述列中提取一些平方米。比如我用过:
df['description'].str.extract('(\d\,\d1,3\s?[sS])', expand=True)
从看起来像“房子是 3,000 平方米”的字符串中提取 3000。
如果我想提取 800 平方米怎么办?所以一个不涉及逗号的条件。我将如何将其添加到条件中。抱歉,我看了一圈还是想不通。
【问题讨论】:
[,\d]+
怎么样?
对不起,我如何将它组合到参数中?
【参考方案1】:
我正在使用str.findall
s=pd.Series(['llll llll llll 100,000.00 lll lll ll ','xyz 800 bgm bhd','80','1,000.00 and 10'])
s.str.findall(r'(?:[,\d]+.?\d*)')
0 [100,000.00]
1 [800]
2 [80]
3 [1,000.00, 10]
dtype: object
【讨论】:
以上是关于从字符串中提取带逗号的数字的主要内容,如果未能解决你的问题,请参考以下文章
如何使用正则表达式从字符串中删除字符串和特殊字符并仅显示不带逗号的数字?
使用 SQL 。从字符串'HEADER|N1000|E1001|N1002|E1003|N1004|N1005'中提取逗号分隔的数字