PHP正则反斜杠的讲究

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PHP正则反斜杠的讲究相关的知识,希望对你有一定的参考价值。

今天看了一篇文章说下自己的理解

文章地址:https://www.t00ls.net/articles-55906.html

先看一段代码,看起来很正常,但是实际上这段代码会报错!

if(preg_match("#\\\\\\\\|\\\\#i",$cmd,$match)){
    var_dump($match);
    echo ("forbid~");
}

它会报错,报错的信息是 结束分隔符 不存在,这里指的 结束分隔符 实际上在php正则中就是 定界符 !

再看这段,只是前后换了下位置 发现就不会报错了!

if(preg_match("#\\\\|\\\\\\\\#i",$cmd,$match)){
    var_dump($match);
    echo ("forbid~");
}

那么问题肯定出现在\\\\上,我们对 $cmd 进行传数据来匹配

$cmd => \\ 单个反斜杠 结果 无匹配

$cmd => \\\\ 两个反斜杠 结果 无匹配

发现结果都不匹配!

那么来看看 \\\\ 的问题所在,其实这里正则中的\\\\ 的解析流程是这样的:

1、 \\\\ 先经过PHP正则解析器为一个\\

2、\\ 又跟\'|\'结合到一起,从而在 正则表达式的解析器解析为\\|

3、又因为\'|\'是正则中的保留符号,所以需要一个转义符来转义,所以\\\\|这个的结果就是匹配 \'|\'

4、后面又跟了\\\\\\\\,这里 先经过PHP正则解析器为 \\\\,然后在经过 正则表达式的解析器为 \'\'

5、那么最后的正则表达式就是匹配|\\ 这两个符号!

那么也就可以理解上面的那个为什么会报错了,因为结果就是匹配\\#,所以我们还需要加个 定界符#,来进行修复

if(preg_match("#\\\\\\\\|\\\\##i",$cmd,$match)){
    var_dump($match);
    echo ("forbid~");
}

这样就不会报错了!

然后看了下面的评论酒馆师傅说代码审计中存在,以后在代码中也需要多多关注!

以上是关于PHP正则反斜杠的讲究的主要内容,如果未能解决你的问题,请参考以下文章

JS正则四个反斜杠的含义

python 正则表达式中反斜杠()的麻烦和陷阱

python 正则表达式中反斜杠()的麻烦和陷阱 (转)

sed命令反斜杠的转义

正则表达式 反斜杠的匹配 2018-11-30

正则表达式:向后看以避免奇数个连续的反斜杠