re模块的基本用法

Posted aizhinong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了re模块的基本用法相关的知识,希望对你有一定的参考价值。

findall:返回每一个匹配的标的,放在一个列表里

ret = re.findall(i,aike listen to me)
print(ret)

#打印:
[i, i]

 

search:返回第一个匹配到的匹配信息,需要调用group方法才能将标的打印,若没有匹配到,返回None

ret = re.search(i,aike listen to me)
print(ret)
print(ret.group())

#打印:
<re.Match object; span=(1, 2), match=i>
i

一般使用方法为:
ret = re.search(i,aike listen to me)
if ret:
    print(ret.group())

 

match:以什么为开头,返回匹配标的的匹配信息,需要调用group方法才能将标的打印出来,若没有匹配,则返回None

ret = re.match(ai,aike listen to me)
print(ret.group())

#打印:
ai

 

split:切割

ret = re.split([ab], abcd)   # 先按‘a‘分割得到‘‘和‘bcd‘,在对‘‘和‘bcd‘分别按‘b‘分割
print(ret)  # [‘‘, ‘‘, ‘cd‘]


ret = re.split((ab), abcd) #优先级的原因,加上括号会保留需要切割的内容
print(ret)  #[‘‘, ‘ab‘, ‘cd‘]

 

sub:更换符合匹配规则的标的,可以设置更换次数,默认全部更换

ret = re.sub(i,1,aike listen to me,1)
print(ret)

#打印:
a1ke listen to me

 

subn:更换符合匹配规则的标的,可以设置更换次数,默认全部更换。返回一个元祖(更换后的结果,更换次数)

ret = re.subn(i,1,aike listen to me)
print(ret)

#打印:
(a1ke l1sten to me, 2)

 

compile:编译字符串类型的正则表达式

job = re.compile(\d4) #将正则表达式编译成一个正则表达式对象,规则匹配的是4个连续的数字
ret = job.search(1121aaa12ak4543as6adas1111aa1524a) #正则表达式对象调用search方法,参数为待匹配的字符串
print(ret.group()) #1121

 

finditer:返回一个存放匹配结果的迭代器

ret = re.finditer(\d4,1121aaa12ak4543as6adas1111aa1524a)
print(ret.__next__().group())
print(ret.__next__().group())
for i in ret:
    print(i.group())

#打印:
1121
4543
1111
1524

 

findall的优先级:

ret = re.findall(name(aike),nameaikename) #findall会先把优先组里匹配到的标的返回
print(ret)

ret = re.findall(name(?:aike),nameaikename)#想要获取全部的匹配结果,取消权限方式是在优先组里面加‘?:‘
print(ret)

#打印:
[aike]
[nameaike]

 

split的优先级:

ret = re.split((\d),hello1ai2ke)
print(ret)#加上括号,会保留匹配的标的

ret = re.split(\d,hello1ai2ke)
print(ret)#正常情况下不会保留

#打印:
[hello, 1, ai, 2, ke]
[hello, ai, ke]

 

以上是关于re模块的基本用法的主要内容,如果未能解决你的问题,请参考以下文章

python之logging模块基本用法

python datetime模块基本用法

re模块及其用法

基本用法:7《自学模块案例》

requests模块的基本用法

re模块的高级用法