正则表达式中的{ } () [] 及re.match re.search

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式中的{ } () [] 及re.match re.search相关的知识,希望对你有一定的参考价值。


1.正则表达式相关说明

() 是为了提取匹配的字符串。表达式中有几个()就有几个相应的匹配字符串。

(\s*)表示连续空格的字符串。

(\d*)表示连续的数字,与[0-9]+类似

[]是定义匹配的字符范围。比如 [a-zA-Z0-9] 表示相应位置的字符要匹配英文字符和数字。[\s*]表示空格或者*号。

{}一般用来表示匹配的长度,比如 \s{3} 表示匹配三个空格,\s[1,3]表示匹配一到三个空格。

(0-9) 匹配 ‘0-9′ 本身。 [0-9]* 匹配数字(注意后面有 *,可以为空)[0-9]+ 匹配数字(注意后面有 +,不可以为空){1-9} 写法错误。

[0-9]{0,9} 表示长度为 0 到 9 的数字字符串

关于[]* 与[]+的示例:

[]*可以返回控制,即可以找不到值,但是[0-9]+不可以为空,如果为空返回错误

>>> c=‘GET /diviner?pin=1123066825_m&p=‘
>>> r=re.search(‘p=([0-9]+)‘,c)
>>> print r.group(1)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: ‘NoneType‘ object has no attribute ‘group‘
>>> print r
None
>>> r=re.search(‘p=([0-9]*)‘,c)
>>> print r.group(1)


----此处返回为空

2.re mathc search说明

match()函数只检测RE是不是在string的开始位置匹配,

search()会扫描整个string查找匹配;

>>> a=‘123aaabcabcabc‘
>>> import re
>>> re.search(‘abc‘,a)
<_sre.SRE_Match object at 0x7fd7534184a8>
>>> re.mathc(‘abc‘,a)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: ‘module‘ object has no attribute ‘mathc‘
>>> re.match(‘abc‘,a)
>>> b=re.match(‘abc‘,a)
>>> print b
None
>>> b=re.match(‘1‘,a)
>>> pint b
  File "<stdin>", line 1
    pint b
         ^
SyntaxError: invalid syntax
>>> print b
<_sre.SRE_Match object at 0x7fd7534188b8>

()在对于group groups的作用---主要起到分组的作用

>>> c=‘GET /diviner?pin=1123066825_m&p=61234‘
>>> r=re.search(‘p=((\d*))‘,c)
>>> print c.group(0)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: ‘str‘ object has no attribute ‘group‘
>>> print r.group(0)
p=61234
>>> r=re.search(‘p=((\d*))‘,c)
>>> r=re.search(‘p=([0-9]*)‘,c)
>>> r=re.search(‘p=[0-9]*‘,c)
>>> print r.group
<built-in method group of _sre.SRE_Match object at 0x7fd7534189f0>
>>> print r.group(0)
p=61234
>>> print r.group(1)---无括号无分组
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: no such group
>>> r=re.search(‘p=([0-9]*)‘,c)
>>> print r.group(1)
61234

以上是关于正则表达式中的{ } () [] 及re.match re.search的主要内容,如果未能解决你的问题,请参考以下文章

如何检查一个Python字符串是否只包含数字?

正则语法及在php中的应用

Linux中的grepegrep及相应的正则表达式和用法

R中的正则表达式及字符处理函数总结

JavaScript属性及正则表达式

正则表达式中的{ } () [] 及re.match re.search