老男孩带你了解perl正则表达式中的零宽断言

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了老男孩带你了解perl正则表达式中的零宽断言相关的知识,希望对你有一定的参考价值。

1.1 前言

本文只介绍perl语言正则表达式的零宽断言功能。

零宽断言实质:匹配文本里面的位置。

零宽断言叫zero-length assertions,也叫lookaround(这个更容易理解)。

包括:lookahead(向前看,零宽度正预测先行断言),lookbehind(向后看,零宽度正回顾后发断言)。

从左到右对文本进行匹配,判断是否符合exp表达式。

名字

表达式

如果子表达式成功则

positive lookahead

(零宽度正预测先行断言)

(?=subexp)

如果匹配到右边则成功

negative lookahead

(零宽度负预测先行断言)

(?!subexp)

如果没有匹配到右边则成功

注:成功就是找到对应的位置

1.2 lookahead 向前看-找到匹配内容前面的位置

技术分享 

如图所示:首先这个是lookahead(向前看)他匹配exp这个词(oldboy)之前的一个位置,同时是 positive lookahead是表示匹配到exp就成功的意思。

注:先理解lookahead的含义。然后对比理解positive lookahead和negative lookahead的区别。

 

1.3 lookbehind 向后看,找到匹配内容的后面的位置

lookbehind(向后看),从右向左匹配,判断是否符合exp表达式。

名字

表达式

如果子表达式成功则

positive lookbehind

(零宽度正回顾后发断言)

(?<=subexp)

如果匹配到左边则成功

negative lookbehind

(零宽度负回顾后发断言)

(?<!subexp)

如果没有匹配到左边则成功

#注:成功就是找到对应的位置

 

技术分享 

1.4 lookahead lookbehind区别

技术分享 

如图所示lookahead匹配的位置是在subexp之前,lookbehind匹配的位置是在subexp之后。

1.5 perl常用的转义字符

转义字符

含义

\b

单词的边界。

\w

表示[a-zA-Z0-9_]中任意一个字符

\W

\w相反表示不在[a-zA-Z0-9_]中的任意字符

\d

[0-9]中的一个数字

\D

不在[0-9]中的任意字符

 

 1.6 案例1:实战演示:取IP地址

  基本格式,红色就是我们的目标。


[[email protected] oldboy]# ifconfig eth0

eth0      Link encap:Ethernet  HWaddr 00:0C:29:3A:C5:88  

          inet addr:192.168.85.50  Bcast:192.168.85.255  Mask:255.255.255.0

          inet6 addr: fe80::20c:29ff:fe3a:c588/64 Scope:Link

          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1

          RX packets:81923 errors:0 dropped:0 overruns:0 frame:0

          TX packets:26480 errors:0 dropped:0 overruns:0 carrier:0

          collisions:0 txqueuelen:1000

          RX bytes:96099065 (91.6 MiB)  TX bytes:3459424 (3.2 MiB)


       方法一:使用positive lookahead(正常向前看,零宽度正预测先行断言)

[[email protected] oldboy]# ifconfig eth0 | grep -oP "[0-9.]+(?=  Bcast)"

192.168.85.50

[[email protected] oldboy]# ifconfig eth0 | grep -oP "[\d.]+(?=  Bcast)"

192.168.85.50 

      说明:

       1.这里使用lookahead的时候要注意,Bcast前面有两个空格,匹配时要注意他们。

       2.前面已经说过,\d è[0-9]

       方法二:使用positive lookbehind(正常向后看,零宽度正回顾后发断言)


[[email protected] oldboy]# ifconfig eth0 | grep -oP ‘(?<=\baddr:)[\d.]+‘

192.168.85.50

     方法三:使用零宽度负预测先行断言

[[email protected] oldboy]# ifconfig eth0|grep -oP ‘addr:[\d\.]+(?![\d\.])‘

addr:192.168.85.50

  但是去掉"addr:"还是需要使用lookbehind(向后看,零宽度正回顾后发断言)


[[email protected] oldboy]# ifconfig eth0|grep -oP ‘(?<=addr:)[\d\.]+(?![\d\.])‘

192.168.85.50

    方法四:使用零宽度负向回顾后发断言


[[email protected] oldboy]# ifconfig eth0|grep -oP ‘(?<![\d\.])[\d\.]+(?)  Bca‘

192.168.85.50  Bca

   但是后面的去除需要使用使用零宽度正预测先行断言


[[email protected] oldboy]# ifconfig eth0|grep -oP ‘(?<![\d\.])[\d\.]+(?)(?=  Bca)‘

192.168.85.50 


更多精彩关注老男孩linux培训

 


本文出自 “老男孩linux培训” 博客,请务必保留此出处http://oldboy.blog.51cto.com/2561410/1931019

以上是关于老男孩带你了解perl正则表达式中的零宽断言的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式的零宽断言

mysql支不支持正则表达式里的零宽断言

Python 正则表达式零宽正负向断言的用法及示例代码

Python 正则表达式零宽正负向断言的用法及示例代码

15.python正则匹配 元字符转义重复或捕获分组断言:零度断言负向零宽断言贪婪非贪婪引擎选项

正则表达式零宽断言