单个字符的匹配规则(正则表达式和re模块)

Posted zyde-2893

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了单个字符的匹配规则(正则表达式和re模块)相关的知识,希望对你有一定的参考价值。

什么是正则表达式:

个人对其的理解:按照一定规则,从某个字符串中匹配出想要的数据。

标准的解释:正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。               -------百度百科

正则表达式常用的匹配规则:

匹配某个字符串:

text = "hello"
retext = re.match("he",text)
print(retext.group())

可以在 text 匹配出 he。

1.只可以顺着匹配,即若开头不是 he,会报错。

2. .group()将匹配到的类型转换成可以读文本。


点(.)匹配任意的字符:

text = "+hello"
ret = re.match(".",text)
print(ret.group())

匹配出 + 。

 

\d:匹配任意的数字字符(0-9)

text = "0+35"
ret = re.match(‘\d‘,text)
print(ret.group())

 

\D:匹配任意的非数字字符

text = "+"
ret = re.match(‘\D‘,text)
print(ret.group())

 

\s:匹配空白字符(\t,\r,\n)

text = " \nab "
ret = re.match(‘\s‘,text)
print(ret.group())

 

\w:匹配a-z,A-Z,数字以及下划线

text = ‘a‘
ret = re.match(‘\w‘,text)
print(ret.group())

 

\W:匹配到时与\w互补的

text = ‘++a‘
ret = re.match(‘\W‘,text)
print(ret.group())

 

[ ]组合的方式:只要满足中括号中的字符,就可以匹配

text = ‘0731-8888888‘
ret = re.match(‘[\d\-]‘,text)
print(ret.group())
其中 [\d\-] 表示匹配 \d (数字0-9)或者 匹配 -。第二个 \ 表示转义。

  可以用[]表示以上的匹配:
1).用中括号代替\d:
text = ‘+09asd+-sad/+‘
ret = re.match(‘[0-9]‘,text)
print(ret.group())
2).用中括号代替\D:
text = ‘+09asd+-sad/+‘
ret = re.match(‘[^0-9]‘,text)
print(ret.group())
3).用中括号代替\w:
text = ‘A+09asd+-sad/+‘
ret = re.match(‘[a-zA-Z0-9_]‘,text)
print(ret.group())
4).用中括号代替\W:
text = ‘+09asd+-sad/+‘
ret = re.match(‘[^a-zA-Z0-9_]‘,text)
print(ret.group())
其中 ^ 表示取非符号。

以上是关于单个字符的匹配规则(正则表达式和re模块)的主要内容,如果未能解决你的问题,请参考以下文章

Python高级详解 正则表达式(re模块)

正则表达式

re模块 - 正则表达式

Python正则表达式 --匹配单个字符

正则表达式和re模块

python 正则表达式与re模块