如何用正则表达式替换多个匹配项/组?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何用正则表达式替换多个匹配项/组?相关的知识,希望对你有一定的参考价值。

通常,我们将编写以下内容替换一个匹配项:

namesRegex = re.compile(r'(is)|(life)', re.I)
replaced = namesRegex.sub(r"butter", "There is no life in the void.")
print(replaced)

output:
There butter no butter in the void.

我想要的是用特定的文本替换每个组,可能使用反向引用。即我想用“ are”代替第一组(is),用“ butterfly”代替第二组(life)。

也许是这样。但是以下代码无效。

namesRegex = re.compile(r'(is)|(life)', re.I)
replaced = namesRegex.sub(r"(are) (butterflies)", r"\1 \2", "There is no life in the void.")
print(replaced)

是否有一种方法可以在python中的一个语句中替换多个组?

答案

您可以使用lambda替换,映射要关联的关键字:

>>> re.sub(r'(is)|(life)', lambda x: {'is': 'are', 'life': 'butterflies'}[x.group(0)], "There is no life in the void.")
'There are no butterflies in the void.'
另一答案

您可以先定义键和替换的映射,然后使用lambda function in replacement

>>> repl = {'is': 'are', 'life': 'butterflies'}
>>> print re.sub(r'is|life', lambda m: repl[m.group()], "There is no life in the void.")
There are no butterflies in the void.

我还将建议您在按键周围使用单词边界来保护您的搜索模式:

>>> print re.sub(r'\b(?:is|life)\b', lambda m: repl[m.group()], "There is no life in the void.")
There are no butterflies in the void.
另一答案

您可以使用具有搜索替换值的字典,并使用简单的\w+正则表达式来匹配单词:

import re
dt = {'is' : 'are', 'life' : 'butterflies'}
namesRegex = re.compile(r'\w+')
replaced = namesRegex.sub(lambda m: dt[m.group()] if m.group() in dt else m.group(), "There is no life in the void.")
print(replaced)

参见Python demo

使用这种方法,您不必担心基于交替创建太大的正则表达式模式。您可以根据要求调整模式以包括单词边界,或仅匹配字母(例如[\W\d_]+)等。要点是,该模式应与字典中所有作为关键字的搜索词匹配。

if m.group() in dt else m.group()部分正在检查找到的匹配项是否作为字典中的键存在,如果不存在,则将匹配项返回。否则,返回字典中的值。

另一答案

如果您只想替换特定的单词,则不要超过str.replace()

str.replace()

以上是关于如何用正则表达式替换多个匹配项/组?的主要内容,如果未能解决你的问题,请参考以下文章

C ++正则表达式替换第一个匹配项

JS如何用正则表达式 获取字符串内的匹配部份?

用不同的替换替换多个正则表达式匹配

如何用正则表达式匹配IP地址

如何用正则表达式匹配出如下代码中的IP地址跟IP地址归属地?

正则表达式:如何访问一个组的多个匹配项? [复制]