本章主要学习正则表达式的基本语法;
正则表达式就是一个匹配的模式,正则表达式本身也就是一个字符串(有一些语法规则,特殊符号组成)
正则表达式这个字符串一定要在对应的函数中使用才有意义(分割,替换函数结合使用)
1、定界符 / /
2、原子 最小的一个匹配单元(放在 / / 中,在正则表达式中,至少有一个。例如:$reg = ‘/ 7 /‘ )
3、元字符 元字符是不能单独使用的,用来修饰元子的,用来扩展原子功能和限字的做补充说明(协助定界符中 例如:$reg = ‘/{5}/‘ )
4、模式修正符 修正,对模式(正则)修正(写在定界符的外面,写在右边 例如: $reg = ‘/ {5} / i ‘ 中的i)
一、界定符号
界定符就表示一个正则表达式的开始和结束
例如:/[0-9]/ | #[0-9]# | {[0-9]} 常用写法建议使用斜杠;// $pattern = ‘/[0-9]/‘
二、原子
可见原子:
1、标点符号; ‘’ _ ? . 等等
2、英文字母数字 a-z, A-Z, 0-9
3、汉语,日文,阿拉伯文等其他文字
4、数理化公司符号
5、其他可见字符
不可见原子:
1、换行符 \n
2、回车 \r
3、制表符 \t
4、空格
5、其他看不见的符号
(所有的数字,所有的字,所有的空白,所有的字母,特殊符号 如下)
. 匹配除换行符之外的任意字符
\d (所有的数字) 代表任意一个数字 [ 0-9 ]
\D (代表所有非数字) 代表任何一个非数字 [ ^0-9 ]
\w 代表任意一个字,a-z A-Z, 0-9 _ [ a-zA-Z0-9_]
\W 代表任意一个非字,a-z A-Z 0-9 _ 之外的所有字符 [ ^ a-zA-Z0-9_ ]
\s 代表空白 [ \t \n \f \v ]
\S 代表任意一个非空白 [^ \t \n \f \v ]
自定义原子表
[ 13579 ]
[ a-zA-Z] 说明:- 是从哪到哪
[ ^a-zA-Z ] 说明: ^ 是除了什么
说明:( . ) 点, 能代表所有的一个原子
三、元字符
元字符这个不能在正则表达式中单独使用,用来修饰原子的
元字符 即原子的筛选方式
* 用来修饰前面的原子可以出现 0 个 1 个 或者 多个
+ 用来修饰前面的原子出现的次数 1 次 或 多次 (不能没有一次)
?用来修饰前面的原子出现的次数 0 次 或 1次
{ m } 用来修饰前面的原子出现 m 次,多一次少一次都不行
{ n, m } 用来修饰前面的原子出现的个数,在 n 到 m 之间,包含 n, m
{ n, } 用来修饰前面的原子可以出现至少 n 次,包含 n
| 或的关系,表示它两边的原子,只有有一个出现就可以,但是 | 的优先级最低
^ 和 \A 表示必须以什么开始,必须写在正则表达式的前面
$ 和 \Z 表示必须以什么结束,必须写在正则表达式的后面
\b 单词边界
\B 非单词边界
()第一个作用:改变优先级别
$str = ‘ orisaabc‘;
$reg = ‘/ or(is|a)abc/‘;
第二个作用:将小原子变成大原子
$str = ‘sqlsalabcsqlddfd‘;
$reg = ‘/(sql)*/‘;
第三个作用:子模式,整个表达式是一个大模式,小括号中的是每一个独立的子模式
第四个作用:反向引用
?: 取消子模式,作为大模式用(?:\d{4})
\1 取子模式
四、模式修正符
模式修正符要放在定界符之外,放在右边,模式修正符一个字符就是一个功能,可以组合使用;
例如: “/ go*gle/ i ”; "/go*gle/ ieu";
作用:
模式修正符号可以修正正则表达式的解释,或者扩充正则表达式的功能;
i 不区分大小写(默认是区分大小写)
m 修正符号修正正则表达式可以视为多行,在使用 ^ 或 $ 时每一行满足都可以(默认为一行)
s 用来修正正则表达式中的换行符号,是包含换行符,不用 s 则不包含换行符,默认不包含换行符
x 忽略修正正则表达式可以省略多个单词之间的空白
U (.* , .+) 正则表达式比较贪婪,.*? 和 .+?可以取消贪婪
贪婪的案例:
$pattern = ‘/myistest.+123/‘; $subject = ‘you look myistest__123123123123‘; $matche = []; preg_match($pattern, $subject, $matche); show($matche);
贪婪的结果:
Array ( [0] => myistest__123123123123 )
取消贪婪的大U:
$pattern = ‘/myistest.+123/U‘; $subject = ‘you look myistest__123123123123‘; $matche = []; preg_match($pattern, $subject, $matche); show($matche);
取消贪婪的结果:
Array ( [0] => myistest__123 )
忽略大小写的案例:i 的用法
$pattern = ‘/myisTest.+123/Ui‘; $subject = ‘you look myistest__123123123123‘; $matche = []; preg_match($pattern, $subject, $matche); show($matche);
输出结果同上;不加 i 是匹配不到结果的;
忽略空白符的案例: x 的使用
$pattern = ‘/m yi s Test.+123/Uix‘; $subject = ‘you look myistest__123123123123‘; $matche = []; preg_match($pattern, $subject, $matche); show($matche);
输出结果同上,不加 x 是匹配不到结果的;
五、实战应用
1、非空匹配 ‘/.+/’
2、浮点数匹配(保留2位)‘/(?!0\.00)(\d+\.\d{2}$)/’
$subject = [‘1.00‘, ‘2.345‘, ‘0.23‘, ‘234‘, ‘23.22‘, ‘0.00‘]; $matche = []; for ($i = 0; $i < count($subject); $i++){ if(preg_match(‘/(?!0\.00)(\d+\.\d{2}$)/‘, $subject[$i], $matche)){ show($matche); } }
结果:
Array ( [0] => 1.00 [1] => 1.00 ) Array ( [0] => 0.23 [1] => 0.23 ) Array ( [0] => 23.22 [1] => 23.22 )
3、手机号码 ‘/^1(3|4|7|8)\d{9}$/’
4、Email地址 ‘/^([0-9A-Za-z\\-_\\.]+)@([0-9a-z]+\\.[a-z]{2,3}(\\.[a-z]{2})?)$/i’ 或者 ‘/^\w+(\.\w+)*@\w+(\.\w+)+$/’
5、常见URL地址 ‘/^(https?://)?(\w\.)+[a-zA-Z]+$/‘
注:学习笔记