正则表达式的括号与贪婪匹配

Posted morein2008

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式的括号与贪婪匹配相关的知识,希望对你有一定的参考价值。

今天遇到一个正则表达式 regex = \'<div class="div_result[\\s\\S]+?>([\\s\\S]+)</div>\'
我原以为将其与网页内容进行匹配之后会获得形如<div class="div_result...</div>这样的完整字符串,但结果只获取了<div></div>之间的内容,十分不解,上网查了之后才知道,原来括号具有获取匹配的作用:
(pattern)———会匹配pattern并获取这一匹配.

而问号除了表示零个或一个之外,还可以抑制贪婪匹配,默认情况下都是贪婪匹配(匹配的越多越好),如果同时有多个模式同时贪婪匹配,最后的结果是相互竞争妥协的结果。

import re

def getRegResults(reg, data):
    pattern = re.compile(reg)
    resultLists = re.findall(pattern, data)
    return resultLists


if __name__==\'__main__\':
    s="abcd_123e  fg hk456"
    reg=\'abc.+([\\s\\S]+?)\\d+\'
    reg2=\'([\\s\\S]+?)\'
    reg3=\'([\\S]?)\'
    reg4=\'([\\s\\S]+?)\'
    reg5=\'([\\S]+)\'
    print getRegResults(reg, s)
    print getRegResults(reg2, s)
    print getRegResults(reg5, s)
    print getRegResults(reg3, s)
    print getRegResults(reg4, s)

 

 

reference:

http://www.cnblogs.com/yirlin/archive/2006/04/12/373222.html

http://www.cnblogs.com/graphics/archive/2010/06/02/1749707.html

以上是关于正则表达式的括号与贪婪匹配的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式的贪婪和非贪婪模式

正则表达式贪婪与非贪婪模式

[ 转载 ] 什么是正则表达式的贪婪与非贪婪匹配

python正则表达式贪婪与非贪婪模式

正则表达式贪婪与非贪婪比较

JavaScript正则表达式,这一篇足矣