解析正则表达式的使用方法

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了解析正则表达式的使用方法相关的知识,希望对你有一定的参考价值。

很多初学者对正则表达式望而却步,那家伙,听到正则来了掉头就跑啊!跑什么呢?跑了就能解决问题吗?当然不能,最后还是要直面它的。

正如伟大领袖毛主席说的那句话一样,其实,正则表达式不过就是一个纸老虎罢了。不信啊,不信请听我郑康来给你们讲解正则表达式:

ps:我可没有打错字哦,没错,我就是叫郑康哦!

好了,言归正传,Linux中的正则表达式其实可以分为两种:一种叫做基础正则表达式,还有一种就是扩展表达式。这里我们只谈基础就足够了,至少应对工作足够了。


① *或a*

*代表全部,但是需要注意的是,这里的*与通配符里的*可不是一回事哦!再次强调一下,通配符是完全匹配,而正则表达式是包含匹配。所谓包含匹配,就是只要包含就显示出来。

如图,test文件中已经写入了很多a和b,这里为了用作演示:

技术分享

看到了吗?坏了,为什么不是把只包含a的都取出来,怎么把b也取出来了呢?那么这时候你们就要先理解在正则表达式中的*到底代表了什么意思?难道不是和通配符中*的意义差不多吗?


哎,还真就差了很多。在正则表达式中的*前面的东西,如上面的a*代表的含义是匹配包含0到无穷个a,

而不是单纯的指仅包含a。

那么这时候要想只取出a应该怎么办呢?有办法,在a的前面再加一个a,这里需要注意,*前面的那个字母是谁无所谓,重点是该字母前的字母。

例如:匹配只包含a的情况

grep "aa*" test

技术分享



② .代表任意一个字符,正则表达式里的.与通配符里的?几乎一模一样

如图:

技术分享













③ ^代表匹配行首

例如:文件test中有said和soid这两个家伙,现在用^把这两个家伙找出来

如图:

技术分享


④ $用于匹配行尾

这个更简单了,直接上代码吧

技术分享


⑤ []用于匹配括号中指定的任意一个字符,这个和通配符中的[]又有些类似。

技术分享


⑥ [^]表示匹配除括号中的字符以外的任意一个字符。啥意思?就是说^放在外面就是匹配行首,放在[]里面就表示取反。

例如,我们来取不包含a的字符

技术分享


哎,这里为什么包含了a呢?其实,[^]真正的含义应该这么理解:过滤只含有a的字符

[^0-9]表示过滤全是数字的字符

[^a-z]表示过滤全是小写字母的字符

[^A-Z]表示过滤全部是大写字母的字符

注意:^[^a-z]表示匹配首字母不是小写字母的字符


⑦ \转义符,用于取消特殊字符的含义。

举个例子,正则表达式中的.就是代表任意字符的意思,但是\.的意思就是单纯的一个“.”


⑧ \{n\}表示前面的字符恰好出现n次

举例:来吧,上图吧

技术分享


⑨ \{n,\}表示前面的字符出现不少于n次

举例:还是搜索那个字符串,废话不多说,一言不合就上图

技术分享


⑩ \{n,m\}表示匹配不少于n,不多于m的字符

如图:

技术分享


亲情通告:如果哪位童鞋遇到看不明白的地方,请加QQ群:579292790


本文出自 “橘洲青年” 博客,请务必保留此出处http://zhengkangkang.blog.51cto.com/12015643/1855452

以上是关于解析正则表达式的使用方法的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式解析

使用正则表达式解析日志文件

使用正则表达式解析 Oracle 脚本

easyui界面正则表达式不解析怎么办?

将正则表达式解析为 AST 的 Python 库?

用于解析网页链接的正则表达式?