正则表达式

Posted waldosia

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式相关的知识,希望对你有一定的参考价值。

正则表达式

==通常用于判断语句中,用来检查某一字符串是否满足某一格式==

正则表达式是由==普通字符==与==元字符==组成
==普通字符==:包括大小写字母、数字、标点符号及一些其他符号
==元字符==:是指在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符或表达式)在目标对象中的出现模式

基础正则表达式常见元字符: ( 支持的工具: grep、 egrep、sed、awk)

\\ :转义字符,用于取消特殊符号的含义,例: \\!、\\n、\\$等
^ : 匹配字符串开始的位置,例: ^a、 ^the、 ^#、^[a-z]
$ :匹配字符串结束的位置,例: word$、 ^$匹配空行
. :匹配除\\n之外的任意的一一个字符,例: go.d、 g..d
* :匹配前面子表达式0次或者多次,例: goo*d、 go. *d,
[list] :匹配list列表中的一个字符,例: go[ola]d, [abc]、 [a-z]、[a-z0-9]、 [0-9]匹配任意一位数字
[^list] :匹配任意非list列表中的一个字符,例: [^0-9]、[^A-Z0-9]、[^a-z]匹配任意一位非小写字母
\\n\\ :匹配前面的子表达式n次,例: go\\2\\d、 [0-9]\\2\\ 匹配两位数字
\\n,\\ :匹配前面的子表达式不少于n次,例: go\\2,\\d、[0-9]\\2, \\匹配两位及两位以上数字
\\n,m\\ :匹配前面的子表达式n到m次,例: go\\2,3\\d、[0-9]\\2, 3\\匹配两位到三位数字
注: egrep、 awk使用n、 n,、 n,m 匹配时“"前不用加“\\”

扩展正则表达式元字符: ( 支持的工具: egrep、 awk);若想使用grep和sed则要:grep -E sed -r

+ :匹配前而子表达式1次以上,例: go+d, 将匹配至少一个o, 如god、good、 goood等
? :匹配前面子表达式0次或者1次,例:go?d,将匹配gd或god
() :将括号中的字符串作为一个整体,例1: g(oo)+d, 将匹配oo整体1次以上,如good、 gooood等
| :以或的方式匹配字条串,例: g(oo|la)d, 将匹配good或者glad

以上是关于正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

markdown 正则表达式模式片段

正则表达式匹配特定的 URL 片段而不是所有其他 URL 可能性

循环通过 python 正则表达式匹配

asp.net 使用正则表达式验证包含打开/关闭括号片段的属性字符串

攻破难啃的骨头-正则表达式(转)

正则表达式的贪婪和非贪婪模式