python re模块常见函数

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python re模块常见函数相关的知识,希望对你有一定的参考价值。

re.match()函数

如果想要从源字符串的起始位置匹配一个模式,我们可以使用re.match()函数。re.match()函数的使用格式是:
re.match(pattern, string, flag)

re.search()函数

我们还可以使用re.search()函数进行匹配,使用该函数进行匹配,会扫描整个字符串并进行对应的匹配。
该函数与re.match()函数最大的不同是,re.match()函数从源字符串的开头进行匹配,而re.search()函数会在全文中进行检索匹配。
示例如下:

import re

pattern1 = "python"
string = "abcdpythonfphp345pythonxadi_py"
result1 = re.search(pattern1, string)

print(result1)
print(result1.group())

执行结果:

<_sre.SRE_Match object; span=(4, 10), match=‘python‘>
python

re.compile()

在以上两个函数中,即便源字符串中有多个结果符合模式,也只会匹配一个结果,那么我们如何将符合模式的内容全部都匹配出来呢?

  1. 使用re.compile()对正则表达式进行预编译。
  2. 编译后,使用findall()根据正则表达式从源字符串中将匹配的结果全部找出。

我们可以通过下面的实例更好理解:

import re

string = "hellomypythonhispythonourpythonend"
pattern = re.compile(".python.")#预编译
result = pattern.findall(string)#找出符合模式的所有结果

print(result)

执行结果:

[‘ypythonh‘, ‘spythono‘, ‘rpythone‘]

可以看到,这段代码会将string中满足pattern模式的结果全部输出,符合条件的结果一共有3个。

re.sub()函数

如果,想根据正则表达式来实现替换某些字符串的功能,我们可以使用re.sub()函数来实现。
使用re.sub这个函数,会根据正式表达式pattern,从源字符串string查找出符合模式的结果,并替换为字符串rep,最多可替换max次。
re.sub()函数的格式如下:
re.sub(pattern,rep,string,max)
其中,第一个参数为对应的正则表达式,第二个参数为要替换成的字符串,第三个参数为源字符串,第四个参数为可选项,代表最多替换的次数,如果忽略不写,则会将符合模式的结果全部替换。

import re

string = "hellomypythonhispythonourpythonend"
pattern = "python."
result1 = re.sub(pattern,"php",string)   # 全部替换
result2 = re.sub(pattern,"php",string,2) # 最多替换2次

print(result1)
print(result2)

结果如下:

hellomyphpisphpurphpnd
hellomyphpisphpurpythonend

第一行输出,由于没有设置第四个参数,全部替换。

以上是关于python re模块常见函数的主要内容,如果未能解决你的问题,请参考以下文章

python 正则表达式re使用模块(match()search()和compile())

珍藏版长文详解python正则表达式

python re 模块 findall 函数用法简述

python中的re模块

python正则表达式re模块的简单使用

Python基础之re模块