正则表达式学习笔记
Posted 可我浪费着我寒冷的年华
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式学习笔记相关的知识,希望对你有一定的参考价值。
/*新手的个人见解,勿以标准作量*/
...待更新
米哥跟我说:“正则表达式说白了就是字符匹配。” 以下是我学习当中的笔记。
正则表达式(Regular Expression)是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")组成的文字模式。
在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。这就是正则的功能!
正则表达式由:定界符、原子、元字符、模式修改符组成。
定界符:一般用"//",也可以用别的比如"{}"、"||"
原子:最小的匹配单位,就是我们要找的字符里最小的单位。写在定界符当中。
元字符:修饰原子,拓展原子功能和限定功能。比如“/7{5}/”中{5}就是用来修饰原子7的,{5}就是一个元字符。元字符要写在定界符里面。/7{5}/:的意思是说原子7的旁边必须要有5。
模式修订符号:修饰正则表达式,对模式(正则)修正,卸载定界符的外面。
普通字符
普通字符包括没有显式(程序员显而易见的方式,故称“显式”,反之难见,一般对编译器称之为“隐式”)指定为元字符的所有可打印(显示器看得到的)和不可打印字符(显示器看不到)。这其中就包括了所有大小写字母、数字、标点符号和一些其他符号。
非打印字符
非打印字符也可以是正则表达式的组成部分。下表列出了表示非打印字符的转义序列:
字符 | 描述 |
---|---|
\cx | 匹配由x指明的控制字符。例如, \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则,将 c 视为一个原义的 ‘c‘ 字符。 |
\f | 匹配一个换页符。等价于 \x0c 和 \cL。 |
\n | 匹配一个换行符。等价于 \x0a 和 \cJ。 |
\r | 匹配一个回车符。等价于 \x0d 和 \cM。 |
\s | 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。 |
\S | 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。 |
\t | 匹配一个制表符。等价于 \x09 和 \cI。 |
\v | 匹配一个垂直制表符。等价于 \x0b 和 \cK。 |
特殊字符
^ 匹配输入字符串的开始位置。
- 代表负号
? 匹配前面的子表达式零次或一次。
[1-9] 匹配1-9个数字
\d 匹配一个数字字符。
* 匹配前面的子表达式任意次。
$ 匹配输入字符串的结束位置。
- 代表负号
? 匹配前面的子表达式零次或一次。
[1-9] 匹配1-9个数字
\d 匹配一个数字字符。
* 匹配前面的子表达式任意次。
$ 匹配输入字符串的结束位置。
以上是关于正则表达式学习笔记的主要内容,如果未能解决你的问题,请参考以下文章