正则表达式特殊字符串学习笔记

Posted 虾扯蛋人生

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式特殊字符串学习笔记相关的知识,希望对你有一定的参考价值。

在学习爬虫的过程中,难免需要用到正则进行一些元素的匹配提取,基于这个考虑,打算认真学习一下正则,高深的不说,常见的元素能够匹配提取出来够用就可以,下面是自己学习正则特殊字符串的一些学习笔记。

1、.

.是正则中最常用的特殊字符串,能够匹配任意字符。一个.匹配一个字符。

2、*

*通常跟在前一个字符串后面,代表出现多个同样的字符串,另外一种理解就是出现大于等于0次。

正则表达式特殊字符串学习笔记

3、+

+基本的用法和*的差不多,区别在于+代表的是至少出现一次,也就是说+代表的是大于等于1。

4、[]

[]在正则表达式中主要有三个作用,使用的地方也比较多。

  • []可以用来让字符串匹配[]中出现的字符,以或的形式进行匹配。

正则表达式特殊字符串学习笔记

  • []可以用来让字符串匹配[]中出现的区间范围内的任意内容。

正则表达式特殊字符串学习笔记

  • []中的^可以匹配非XX的任意内容,这里的^不同于稍后我们要说的特殊字符串^

正则表达式特殊字符串学习笔记

5、^和$

^是指要匹配的字符串以什么开头,$是指要匹配的字符串以什么结尾。

正则表达式特殊字符串学习笔记

6、?

?是用来匹配非贪婪模式的,所谓的非贪婪是指最小匹配,比如有N个都满足,非贪婪模式只会匹配最先满足条件的。

7、|

|可以理解为或操作,匹配的时候|两边只要满足一个就可以匹配到,如果有多个条件的话,可以用多个|隔开。

正则表达式特殊字符串学习笔记

8、{}

{}主要有三种具体的使用方法,下面分别介绍一下。{n},匹配前一个字符出现n次,属于=操作{n,},匹配前一个字符至少n次,属于>=操作{m,n}匹配前一个字符最少m次,最多n次,属于>= & <=操作

9、\s和\S

\s\S是一对对立的特殊字符,其中\s表示一个空格字符,\S表示一个非空字符。

10、 \w和\W

\w\W也是一对对立的特殊字符,\w匹配包括下划线的任何单词字符。等价于"[A-Za-z0-9_]"。\W匹配任何非单词字符。等价于 "[^A-Za-z0-9_]"。

11、\

\是指转义符,如果字符串中有正则表达式中的特殊字符串,如果需要匹配的话,需要在特殊字符串前加\正则表达式基本的特殊字符串就差不多这么些,其他的使用的频率不是很高,暂时不打算学习,后面用到的时候再说。下一篇文章打算说说python中正则表达式该如何用,有哪些常见的函数及其用法、例子等。


以上是关于正则表达式特殊字符串学习笔记的主要内容,如果未能解决你的问题,请参考以下文章

学习正则表达式笔记

正则表达式学习笔记

python基础学习笔记(十三)

正则表达式-Csharp 学习笔记

正则表达式学习笔记

正则表达式学习笔记