用python的re(正则表达式)模块匹配英文环境下的括号
Posted 云忘归
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用python的re(正则表达式)模块匹配英文环境下的括号相关的知识,希望对你有一定的参考价值。
在用re(正则表达式)模块匹配掉文本中的括号时,总是出现各种各样的问题,经过将近一个小时的摸索,终于找到了问题的所在。
案例:
将 txt = ‘Linux系统安装 - 1.1(Av20994127,P1).Flv‘ 中的(Av20994127,P1)匹配出来,再用re.sub()去掉。
初次尝试:
import re
tx = re.search(‘.*?((.*?)).Flv‘, txt)
re.sub(tx.group(1), ‘‘, txt)
Out[1]: ‘Linux系统安装 - 1.1().Flv‘ # 括号()仍在,无法去掉。
解决方案:
import re
tx = re.search(‘.*?((.*?)).Flv‘, txt)
re.sub(‘(‘+tx.group(1)+‘)‘, ‘‘, txt) # 在tx.group(1) 前后分别加上 ‘(‘ 与 ‘)‘
# 由于才疏学浅,具体原理不明,如有高人路过,还望解答。
Out[2]: ‘Linux系统安装 - 1.1.Flv‘ # 括号()被去掉。
进阶:
当文本中只有一个括号(单括号)时,即:text = ‘Linux系统安装 - 1.1(Av20994127,P.Flv‘
用相同的方法,出现 error: missing ), unterminated subpattern 的错误。
经摸索发现,解决方案如下:
import re
text = ‘Linux系统安装 - 1.1(Av20994127,P.Flv‘
result = re.search(‘.*?((.*?,P),Flv‘, text)
new = re.sub(‘\‘ + result.group(1), ‘‘, text) # 在result.group(1)前面加 ’\‘
Out[3]: ‘Linux系统安装 - 1.1.Flv‘
以上是关于用python的re(正则表达式)模块匹配英文环境下的括号的主要内容,如果未能解决你的问题,请参考以下文章