正则表达式匹配文本中包含换行符等空白字符如何匹配
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式匹配文本中包含换行符等空白字符如何匹配相关的知识,希望对你有一定的参考价值。
有多种处理方法: 1、使用[\s\S]匹配任意字符,而不是使用“.”2、使用s单行修饰模式,例:$pattern = '#abc.*?def#s'; //能匹配abc换行def3、使用\s*匹配换行和空格,php里\s能匹配空白字符,含换行 php里的中文使用 [\x7f-\xff]表示,因此,使用正则: $pattern = '#[\x7f-\xff]+(?:\s*[\x7f-\xff]+)*#'; 即可 参考技术A \s可以匹配所有空白字符,包括空格,tab,换行符
正则里的.*和.*?区别
\s匹配任意的空白符(包括空格,制表符(Tab),换行符,中文全角空格)
\S则是任意不是空白符的字符
?涉及到贪婪模式
当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。以这个表达式为例:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。
有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧:
a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab(第一到第三个字符)和ab(第四到第五个字符)
来源:https://zhidao.baidu.com/question/297472922.html
以上是关于正则表达式匹配文本中包含换行符等空白字符如何匹配的主要内容,如果未能解决你的问题,请参考以下文章
如何使用正则表达式匹配 Ruby 中包含特殊字符的重复模式?