Python之re模块

Posted 幸福的小耗子

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python之re模块相关的知识,希望对你有一定的参考价值。

re模块下的常用方法

import re

ret = re.findall(a, ha ha xiao)  # 返回所有满足匹配条件的结果,放在列表里
print(ret)  # 结果 : [‘a‘, ‘a‘,‘a‘]

ret = re.search(a, ha ha xiao)
print(ret.group())  # 结果 : ‘a‘
# 函数会在字符串内查找模式匹配,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以
# 通过调用group()方法得到匹配的字符串,如果字符串没有匹配,则返回None。

ret = re.match(a, abc)  # 从头开始匹配,如果正则从头开始就可以匹配上,就返回一个变量,调用group可以查看,若没有匹配上则返回None,调用group会报错
print(ret.group())
# 结果 : ‘a‘

ret = re.split([ab], abcd)  # 先按‘a‘分割得到‘‘和‘bcd‘,在对‘‘和‘bcd‘分别按‘b‘分割
print(ret)  # [‘‘, ‘‘, ‘cd‘]

ret = re.sub(d, H, hao3xing4an5, 1)  # 将数字替换成‘H‘,参数1表示只替换1个
print(ret)  # haoHxing4an5

ret = re.subn(d, H, hao3xing4an5)  # 将数字替换成‘H‘,返回元组(替换的结果,替换了多少次)
print(ret)

obj = re.compile(d*)  # 将正则表达式编译成为一个 正则表达式对象,规则要匹配的是多个数字
ret = obj.search(qera123efgh)  # 正则表达式对象调用search,参数为待匹配的字符串
print(ret.group())  # 结果 : 123

import re
ret = re.finditer(d, aew3ss4686wwq)   # finditer返回一个存放匹配结果的迭代器
print(ret)  # <callable_iterator object at 0x7fb5c6b8fc50>
print(next(ret).group())  # 查看第一个结果,注意结果是字符串类型
print(next(ret).group())  # 查看第二个结果
print([i.group() for i in ret])  # 查看剩余结果

注意:

1、findall的优先级查询

import re

ret = re.findall(haohao ai (basketball|football)‘, haohao ai basketball)
print(ret)  # [‘basketball‘]     这是因为findall会优先把匹配结果组里内容返回,如果想要匹配结果,取消权限即可

ret = re.findall(haohao ai (?:basketball|football), haohao ai basketball)
print(ret)  # [‘haohao ai basketball‘]

2、split的优先级查询

import re
ret = re.split(d+,haha3xiao6le)
print(ret)  # 结果[‘haha‘,‘xiao‘,‘le‘]

ret = re.split((d+),haha3xiao6le)
print(ret)  # 结果[‘haha‘,‘3‘,‘xiao‘,‘6‘,‘le‘]

# 在匹配部分加上()之后输出的结果不同,加上()保留了分割元素

 

以上是关于Python之re模块的主要内容,如果未能解决你的问题,请参考以下文章

python模块之re模块

python常用模块之re模块(正则)

常用模块之re模块以及正则表达式扩展

python 模块之-re

python之re模块

Python 入门之 内置模块 -- re模块