linux学习-正则表达式基础

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了linux学习-正则表达式基础相关的知识,希望对你有一定的参考价值。

“.”符号

点符号用于匹配除换行符之外的任意一个字符。例如:r.t可以匹配rot rut,但是不能匹配root,若使用r..t就可以匹配root、ruut、r t(中间是两个空格)等。下面的例子是从/etc/passwd中搜索出“包含r,紧跟着两个字符,后面在接t”的行。

grep ‘r..t‘ /etc/passwd

技术分享图片

“”符号

“”符号用于匹配前一个字符0次或者任意多次,比如ab,可以匹配a,ab,abb等。“”符号经常和“.”符号在一起使用。比如“.”代表任意长度的不包含换行的字符。下面的例子是试图找到连续的r字母紧跟着字母t的行。由于在/etc/passwd中没有rt,rrt这样的匹配,所以该表达式实际上只找出了包含t的行(r匹配了0次)

grep ‘r..t‘ /etc/passwd

技术分享图片
如果把上面的‘rt’换成‘r.t’,代表查找包含字母r,后面紧跟任意长度的字符,再跟一个字母t的行。如下所示:

grep ‘r.*t‘ /etc/passwd

技术分享图片

“{n,m}”符号

虽然“”可用于重复匹配前一个字符,但却不能精确地控制匹配的重复次数,使用“{n,m}”符号则能更加灵活地控制字符重复的次数:
{n,} 匹配前面的字符n次,下列匹配的是包含root的行(r和t包含两个o)

grep ‘r.*t‘ /etc/passwd
技术分享图片

{n,} 匹配前面的字符至少n次以上(含n次)

grep ‘ro{0,}t‘ /etc/passwd

技术分享图片

“^”符号

匹配开头的字符,例如“^root”匹配的是以字母root开始的行
grep ‘^root‘ /etc/passwd

技术分享图片

“$”符号

此符号用于匹配尾部,例如“abc$”代表以abc结尾的行。如果是"^$"则代表为空,因为^和$之间什么都没有。下面匹配的是以r开头,中间有一串任意字符,以h结尾的行。

grep ‘^r.*h$‘ /etc/passwd

技术分享图片

“[]”符号

用于匹配方括号内出现的任一字符。比如单项选择题的答案,可能是A,B,C,D选项的任一种,用正则表达式就是[ADCD]。如果遇到比较大范围的匹配,比如说要是匹配任意一个大写字母,就需要使用“-”号做范围限定,写成[A-Z],要匹配所有的字母则写成[A-Za-z]
以匹配手机号为例,手机号是11位连续的数字,第一位一定是1,所以表示为“^1”;第二位可能是3(移动)或者8(联通),表示为“[38]”;后续9个任意数字,表示为‘[0-9]’,所以整个表达式写为“^1[38][0-9]{9}”

"<"和“>”

这两个符号分别用于界定单词的左边界和右边界。比如“<hello”用于匹配hello开头的单词,而“hello>”用于匹配hello结尾的单子。可以使用“<hello>”精确匹配hello这个单词

“d”

匹配一个数字,等价于[0-9]

其他符号说明

 匹配单词的边界
B 匹配非单词的边界
w 匹配字母、数字和下划线,等价于[A-Za-z0-9]
W匹配非字母、非数字、非下划线等价于[^A-Za-z0-9]
匹配换行符
匹配回车符
匹配制表符
f 匹配换页符
s 匹配任何空白字符
S 匹配任何非空白字符

以上是关于linux学习-正则表达式基础的主要内容,如果未能解决你的问题,请参考以下文章

Linux学习笔记:Shell基础正则表达式

Linux学习8之Shell编程--基础正则表达式

linux基础学习-10.3-正则表达式详解

学习linux-基础九(正则表达式)

linux 学习基础4正则表达式

linux学习-正则表达式基础