Python re 模块findall() 函数返回值展现方式详解

Posted springionic

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python re 模块findall() 函数返回值展现方式详解相关的知识,希望对你有一定的参考价值。

findall 函数:

在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

注意: match 和 search 是匹配一次 findall 匹配所有,match 和 search 的区别也很大,可以自行网上查找!

 

这里主要需要讨论的是其返回值的展现方式,即findall函数根据正则表达式的不同所返回的结果包含的不同信息!

 

主要包含三种情况:

  1. 当给出的正则表达式中带有多个括号时,列表的元素为多个字符串组成的tuple,tuple中字符串个数与括号对数相同,字符串内容与每个括号内的正则表达式相对应,并且排放顺序是按括号出现的顺序。

 1 # 例子,正则表达式里分了两个组
 2 
 3 import re
 4 
 5 test = 2018年的下半年,9月份, 27日
 6 pattern = re.compile(r(\\d)+(年|月|日))
 7 res = pattern.findall(test)
 8 print(res)
 9 
10 # 输出结果: [(‘8‘, ‘年‘), (‘9‘, ‘月‘), (‘7‘, ‘日‘)]

  2. 当给出的正则表达式中带有一个括号时,列表的元素为字符串,此字符串的内容与括号中的正则表达式相对应(不是整个正则表达式的匹配内容)。

 1 # 例子,正则表达式里有一个分组
 2 
 3 import re
 4 
 5 test = 2018年的下半年,9月份, 27日
 6 pattern = re.compile(r\\d+(年|月|日))
 7 res = pattern.findall(test)
 8 print(res)
 9 
10 # 输出结果: [‘年‘, ‘月‘, ‘日‘]

  3. 当给出的正则表达式中不带括号时,列表的元素为字符串,此字符串为整个正则表达式匹配的内容。

 1 # 例子,正则表达式里没有分组
 2 
 3 import re
 4 
 5 test = 2018年的下半年,9月份, 27日
 6 pattern = re.compile(r\\d4年|\\d1月|\\d2日)
 7 res = pattern.findall(test)
 8 print(res)
 9 
10 # 输出结果: [‘2018年‘, ‘9月‘, ‘27日‘]

  4. 同样是前面的 test 数据,要匹配出和3中同样的结果,可以这样写。

 1 # 例子,输出和3中同样的结果
 2 
 3 import re
 4 
 5 test = 2018年的下半年,9月份, 27日
 6 pattern = re.compile(r\\d1,4(?:年|月|日))
 7 res = pattern.findall(test)
 8 print(res)
 9 
10 # 输出结果: [‘2018年‘, ‘9月‘, ‘27日‘]

  此例子中的 (?:年|月|日) 不表示一个分组,有一个博客网址可以了解一下正则知识。虽然还是python2版本的,但是应该也没有什么太大的变化!

  https://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html

以上是关于Python re 模块findall() 函数返回值展现方式详解的主要内容,如果未能解决你的问题,请参考以下文章

python re模块findall()详解

Python之正则re模块 --- findall()详解

python re模块findall使用

python re模块findall()详解

Python 正则re模块之compile()和findall()详解

网络爬虫re模块的findall()函数