正则表达式(.+?)与(.+)区别

Posted Spider-spiders

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式(.+?)与(.+)区别相关的知识,希望对你有一定的参考价值。

(.+) 代表的是贪婪,匹配从左到右。

(.+?)代表的是非贪婪,匹配从右到左。

昨天碰到的问题,在BBs问了得出的答应如下./(.+?)b/is  是非贪婪模式 匹配ab /(.*)b/is 是贪婪模式 匹配abb,

那么我们来看看基本的符号说明:

*                                0次、1次或多次匹配其前的原子
+                                1次或多次匹配其前的原子
?                                0次或1次匹配其前的原子
.                                匹配除换行之外的任何一个字符

再看看简单的例子:

你测试.+?和.*当然看不出区别了
测试这个字符串看看
‘aaa<div style="font-color:red;">123456</div>bbb‘
<.+?>会匹配<div style="font-color:red;">和</div>
<.*>会匹配<div style="font-color:red;">123456</div>

最后看看高手怎么说的.

(.+)默认这是贪婪匹配
贪婪是先看整个字符串是否匹配, 如果不匹配,它会去掉字符串的最后一个字符, 并再次尝式, 如果还不匹配, 那么再去掉当前最后一个, 直到发现匹配或不剩任何字符.
过程大概这样:
$str=‘abcdabceba‘
/.+b/  // 匹配一个或多个任意字符后面跟一个字母 b

第一次(先看整个字符串是否是一个匹配) abcdabceba 不匹配,然后去掉最后一个字符 a
第二次(去掉最后一个字符后再匹配) abcdabceb  正确退出

惰性是从左侧第一个字符开始向右匹配, 先看第一个字符是不是一个匹配, 如果不匹配就加入下一个字符再尝式匹配, 直到发现匹配...
过程大概这样
$str=‘abcdabceba‘
/.+?b/ // 同样匹配一个或多个任意字符后面跟一个字母 b

第一次(读入左侧第一个字符) a 不匹配加一个再式
第二次 ab  匹配记录下来,继续(如果匹配所有的话,比如 preg_match_all, 或preg_replace, 不是所有到这儿就停了
第三次 c
...
cdab  匹配记录下来,继续
...
ceb  匹配记录下来,继续

a 到最后了没有了退出


简单例子:
<?php
//这里因为没有用all, .+?只匹配一次

        
$str=‘abcdabceba‘;
        
preg_match(‘/.+b/‘, $str, $s);
        echo
$s[0]; // abcdabceb
        
        
echo"   ";
        
preg_Match(‘/.+?b/‘, $str, $s);
        echo
$s[0]; // ab
        
        
echo"   ";
        
preg_Match(‘/.+b/U‘, $str, $s); //等同于 /.+?b/
        
echo $s[0]; //ab
?>

refer to: http://syeca.imgxm.com/web/index.php?m=content&c=index&a=show&catid=16&id=956

以上是关于正则表达式(.+?)与(.+)区别的主要内容,如果未能解决你的问题,请参考以下文章

如果正则表达式中的 `\A` 与 `^` (插入符号)之间有区别?

解析posix与perl标准的正则表达式区别

正则表达式加与星号的区别? [复制]

正则表达式加与星号的区别? [复制]

正则表达式(.+?)与(.+)区别

正则表达式:贪婪与非贪婪