数据处理正则匹配指定字符传后面的字符

Posted 2021-06-13 兔子爱读书

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了数据处理正则匹配指定字符传后面的字符相关的知识，希望对你有一定的参考价值。

方法1：匹配，捕获(存储)

正则表达式：(?<=(href=")).{1,200}(?=(">))

解释：(?<=(href=")) 表示匹配以(href=")开头的字符串，并且捕获(存储)到分组中

(?=(">)) 表示匹配以(">)结尾的字符串，并且捕获(存储)到分组中

方法2：匹配，不捕获(不存储)

正则表达式：(?<=(?:href=")).{1,200}(?=(?:">))

解释：(?<=(?:href=")) 表示匹配以(href=")开头的字符串，并且不捕获(不存储)到分组中

(?=(?:">)) 表示匹配以(">)结尾的字符串，并且不捕获(不存储)到分组中

分组语法捕获
(exp) 匹配exp,并捕获文本到自动命名的组里
(?<name>exp) 匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)
(?:exp) 匹配exp,不捕获匹配的文本
位置指定
(?=exp) 匹配exp前面的位置
(?<=exp) 匹配exp后面的位置
(?!exp) 匹配后面跟的不是exp的位置
(?<!exp) 匹配前面不是exp的位置

(?:pattern)	非获取匹配，匹配pattern但不获取匹配结果，不进行存储供以后使用。这在使用或字符“(\|)”来组合一个模式的各个部分是很有用。例如“industr(?:y\|ies)”就是一个比“industry\|industries”更简略的表达式。
(?=pattern)	非获取匹配，正向肯定预查，在任何匹配pattern的字符串开始处匹配查找字符串，该匹配不需要获取供以后使用。例如，“Windows(?=95\|98\|NT\|2000)”能匹配“Windows2000”中的“Windows”，但不能匹配“Windows3.1”中的“Windows”。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。
(?!pattern)	非获取匹配，正向否定预查，在任何不匹配pattern的字符串开始处匹配查找字符串，该匹配不需要获取供以后使用。例如“Windows(?!95\|98\|NT\|2000)”能匹配“Windows3.1”中的“Windows”，但不能匹配“Windows2000”中的“Windows”。
(?<=pattern)	非获取匹配，反向肯定预查，与正向肯定预查类似，只是方向相反。例如，“(?<=95\|98\|NT\|2000)Windows”能匹配“2000Windows”中的“Windows”，但不能匹配“3.1Windows”中的“Windows”。
(?<!pattern)	非获取匹配，反向否定预查，与正向否定预查类似，只是方向相反。例如“(?<!95\|98\|NT\|2000)Windows”能匹配“3.1Windows”中的“Windows”，但不能匹配“2000Windows”中的“Windows”。这个地方不正确，有问题

以上是关于数据处理正则匹配指定字符传后面的字符的主要内容，如果未能解决你的问题，请参考以下文章