re模块的基本用法

Posted 2022-09-02 aizhinong

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了re模块的基本用法相关的知识，希望对你有一定的参考价值。

findall：返回每一个匹配的标的，放在一个列表里

ret = re.findall(‘i‘,‘aike listen to me‘)
print(ret)

#打印：
[‘i‘, ‘i‘]

search：返回第一个匹配到的匹配信息，需要调用group方法才能将标的打印，若没有匹配到，返回None

ret = re.search(‘i‘,‘aike listen to me‘)
print(ret)
print(ret.group())

#打印：
<re.Match object; span=(1, 2), match=‘i‘>
i

一般使用方法为：
ret = re.search(‘i‘,‘aike listen to me‘)
if ret:
    print(ret.group())

match：以什么为开头，返回匹配标的的匹配信息，需要调用group方法才能将标的打印出来,若没有匹配，则返回None

ret = re.match(‘ai‘,‘aike listen to me‘)
print(ret.group())

#打印：
ai

split：切割

ret = re.split(‘[ab]‘, ‘abcd‘)   # 先按‘a‘分割得到‘‘和‘bcd‘,在对‘‘和‘bcd‘分别按‘b‘分割
print(ret)  # [‘‘, ‘‘, ‘cd‘]


ret = re.split(‘(ab)‘, ‘abcd‘) #优先级的原因，加上括号会保留需要切割的内容
print(ret)  #[‘‘, ‘ab‘, ‘cd‘]

sub：更换符合匹配规则的标的，可以设置更换次数，默认全部更换

ret = re.sub(‘i‘,‘1‘,‘aike listen to me‘,1)
print(ret)

#打印：
a1ke listen to me

subn：更换符合匹配规则的标的，可以设置更换次数，默认全部更换。返回一个元祖（更换后的结果，更换次数）

ret = re.subn(‘i‘,‘1‘,‘aike listen to me‘)
print(ret)

#打印：
(‘a1ke l1sten to me‘, 2)

compile：编译字符串类型的正则表达式

job = re.compile(‘\d4‘) #将正则表达式编译成一个正则表达式对象，规则匹配的是4个连续的数字
ret = job.search(‘1121aaa12ak4543as6adas1111aa1524a‘) #正则表达式对象调用search方法，参数为待匹配的字符串
print(ret.group()) #1121

finditer：返回一个存放匹配结果的迭代器

ret = re.finditer(‘\d4‘,‘1121aaa12ak4543as6adas1111aa1524a‘)
print(ret.__next__().group())
print(ret.__next__().group())
for i in ret:
    print(i.group())

#打印：
1121
4543
1111
1524

findall的优先级：

ret = re.findall(‘name(aike)‘,‘nameaikename‘) #findall会先把优先组里匹配到的标的返回
print(ret)

ret = re.findall(‘name(?:aike)‘,‘nameaikename‘)#想要获取全部的匹配结果，取消权限方式是在优先组里面加‘?:‘
print(ret)

#打印：
[‘aike‘]
[‘nameaike‘]

split的优先级：

ret = re.split(‘(\d)‘,‘hello1ai2ke‘)
print(ret)#加上括号，会保留匹配的标的

ret = re.split(‘\d‘,‘hello1ai2ke‘)
print(ret)#正常情况下不会保留

#打印：
[‘hello‘, ‘1‘, ‘ai‘, ‘2‘, ‘ke‘]
[‘hello‘, ‘ai‘, ‘ke‘]

以上是关于re模块的基本用法的主要内容，如果未能解决你的问题，请参考以下文章