常见通用字符
\w | 匹配任意一个字母、数字或下划线 |
\W | 匹配除字母、数字和下划线意外的任意一个字符 |
\d | 匹配任意一个十进制数 |
\D | 匹配除十进制以外的任意一个其他字符 |
\s | 匹配任意一个空白字符 |
\S | 匹配一个除空白字符以外的任意一个其他字符 |
常见元字符
. | 匹配除换行符以外的任意字符 |
^ | 匹配字符串开始的位置 |
$ | 匹配字符串结束的位置 |
* | 匹配0次、1次或多次前面的原子 |
? | 匹配0次或一次前面的原子 |
+ | 匹配1次或多次前面的原子 |
{n} | 前面的原子恰好出现n次 |
{n,} | 前面的原子至少出现n次 |
{m,n} | 前面的原子至少出现n次,至多出现m次 |
| | 模式选择字符 |
() | 模式单元字符 |
模式修正符
I | 匹配是忽略大小写 |
M | 多行匹配 |
L | 做本地化识别匹配 |
U | 根据Unicode字符及解析字符 |
S | 让.匹配包括换行符,即用了该模式修正后,“.”匹配就可以匹配任意字符了 |
原子表
[xyz]代表中括号内任意一个原子进行匹配
[^xyz]代表除了中括号内的原子均可以匹配