Python正则表达式
Posted 不秃不强
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python正则表达式相关的知识,希望对你有一定的参考价值。
正则表达式
正则表达式的定义:
正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)
和特殊字符(称为"元字符")。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法
规则的字符串。
正则表达式的作用:(1)通用的字符串表达框架;(2)简洁表达一组字符串的表达式;(3)
针对字符串表达“简洁”和特征的思想工具;(4)判断某字符串的特征归属。
正则表达式常用于文本处理,通常用于这几方面:(1)表达文本类型的特征;(2)同时查找
或替换一组字符串;(3)匹配字符串的全部或部分(用的最广泛)。
正则表达式的使用:编译,将符合正则表达式语法的字符串转化成正则表达式特征。
正则表达式的语法:正则表达式语法是由字符和操作符构成。
常用的操作符:
经典实例:
^[A-Za-z]+$ 由26个字母组成的字符串
^[A-Za-z0-9]+$ 由26个字母和0到9数字组成的字符串
^-?\\d+$ 整数形式字符串(复数前面有"-"号)
^[0-9]*[1-9][0-9]*$ 正整数形式字符串
[1-9]\\d{5} 中国境内邮政编码,6位
[\\u4e00-\\u9fa5] 匹配中文字符
\\d{3}-\\d{8}|\\d{4}-\\d{7} 国内电话号码(前面3位,后面8位,或者前面4位,后面7位)
re库的使用
re库主要用途为进行字符串匹配,用raw string类型(原生字符串类型,\'\\\'不解释为转义符)来
表达正则表达式(可以使用String类型,但会更繁琐,因为有的操作符有‘\\’,因此有转义符时就
有‘\\\\’)
re.search(pattern,string,flag=0):
pattern是正则表达式的字符串,string是待匹配的字符串,flag是控制标记,常用的三种标记
为re.I,re.M,re.S(功能分别为“忽略正则表达式大小写,“使正则表达式的给定字符每行的开始
部分(字符串有多行时)”,“使正则表达式的\'.\'操作符能匹配所有字符(除换行外)”)
1 import re 2 match = re.search(r\'[1-9]\\d{5}\',\'qian100861\') 3 if match: 4 print(match.group(0))
以上是关于Python正则表达式的主要内容,如果未能解决你的问题,请参考以下文章