7.re正则表达式
Posted Mrs.King_UP
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了7.re正则表达式相关的知识,希望对你有一定的参考价值。
-
操作符号:(在字符之后)
. 任何单个字符(除换行符)
[ ]对单个字符给出范围 ;[abc]表示a、b、c任选其一
[^ ]对单个字符给出排除范围;[^abc]表示非a或b或c
* 前一个字符0次或无限次扩展
+ 前一个字符1次或无限次扩展
?前一个字符0次或1次扩展
| 左右表达式中任意一个
扩展前一个字符m次 ab2c表示abbc
m,n扩展前一个字符[m,n]次 ab1,2c表示abc、abbc
^匹配字符串开头 ^abc表示以abc开头的字符串
$匹配字符串结尾 abc$表示以abc结尾的字符串
()分组标记 (ABC)表示abc,(abc|def)表示abc、def
\\d 等价于[0-9]
\\w 等价于[A-Za-z0-9] -
经典的字符串表达式
0-99:[1-9]?\\d
IP地址:
原生字符串:不包含转移字符的字符串
大陆邮编:r’[1-9]\\d5’
电话号码:r’\\d3-\\d8|\\d4-\\d7’ -
re库的函数
- 函数式用法:一次操作
match=re.search(pattern,string,flags):返回第一个匹配的match对象,如果没有返回None
pattern为正则表达式的原生字符串;string为要匹配的字符串;flag为正则表达式使用时的控制标记(re.I:忽视正则表达式中的大小写;re.M:^操作符能够从string的每行开头开始匹配;re.S:.能够匹配所有字符,包括换行符)
match.group(0)返回值
re.match(pattern,string,flags):在string开头位置匹配,返回match
re.findall():搜索字符串,以列表类型返回全部能匹配的子串
re.split():返回分割符,为列表类型
除以上三个参数外,还有maxsplit参数,表示最大分割数,剩余部分作为最后一个元素输出 - re.finditer()搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象
- re.sub(pattern,repl,string,count=0,flags)返回替换后的字符串
将string按照pattern匹配,并讲匹配到的字符串用repl进行匹配,匹配count个,达代表最大匹配次数
- 函数式用法:一次操作
-
等价用法re.compile()
将正则表达式的字符串形式编译成正则表达式对象
一次执行,多次使用
regex=re.compile(pattern,flags=0)#正则表达式对象,代表一组字符串
regex.search()
regex.match()
regex.findall()
regex.split() -
原生字符串raw string——看到的是什就是什么
原始字符串前加r:让每个字符像原来的样子,print(r’D:\\note’)
原始字符串中有引号:也是需要转义才可以,print(r’let’s go home’)
以上是关于7.re正则表达式的主要内容,如果未能解决你的问题,请参考以下文章
全网最全正则表达式系统讲解,实战练习,豆瓣案例解析(附讲解源代码)