正则表达式的基础知识

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式的基础知识相关的知识,希望对你有一定的参考价值。

1、正则表达式的组成

定界符、原子、元字符、模式修正符

匹配原则是从左到右

2、定界符

用于确定正则表达式字符串的边界

不能使用:a-z、A-Z、0-9、\、空格

通常使用:‘/正则匹配/‘

3、原子

原子是正则表达式中最基本的单位

特殊原子

\d:0-9 [0-9]

\D:除了0-9 [^0-9]

\w:字,a-z、A-Z、0-9、_   [a-zA-Z0-9_] 

\W:除了字以外的字符 [^a-zA-Z0-9_]

\s:空白字符,空格、\n、\r、\t等 [\t\n\r]

\S  空白字符以外的字符 [^\t\n\r]

\b:单词边界匹配,所有\W都是词边界  

\B:非次边界

[]:原子列表(匹配其中的任意字符)

^:用在[]内表示取反 

.:任意非\n字符


4、元字符

用于修饰前面的原子,对其进行限定,不能单独存在

*:任意次

+:至少1次

?:0或1次

{}:指定次

^:以指定字符开头

\A:同上

$:以指定字符结尾

\Z:同上

|:或,优先级最低

():作为一个整体(了解,子模式)

5、模式修正符

对整个正则表达式的匹配模式进行限定

i:忽略大小写

m:多行模式

s:让点匹配\n,测试时正则表达式一定要使用"",因为‘‘中的\n不解释

x:忽略正则表达式中的空格

A:必须从开头匹配,等价于^

U:取反正则中的贪婪,匹配默认是贪婪的

.+?:取消至少一次的贪婪,即只匹配1个字符

.*?:取消任意多次的贪婪,即只匹配0个字符


6、正则函数

preg_match:执行一次正则匹配

preg_match_all:执行全局正则匹配

preg_replace:匹配并替换

preg_split:通过正则表达式分割字符串


本文出自 “你好我是森林” 博客,请务必保留此出处http://chensenlin.blog.51cto.com/10559465/1845285

以上是关于正则表达式的基础知识的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式之原理篇

正则表达式基础知识

正则表达式基础---转自 Python正则表达式指南 前边

python正则表达式---正则表达式基础

Linux 基础正则表达式

python基础之正则表达式