正则表达式特殊字符串学习笔记
Posted 虾扯蛋人生
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式特殊字符串学习笔记相关的知识,希望对你有一定的参考价值。
在学习爬虫的过程中,难免需要用到正则
进行一些元素的匹配提取,基于这个考虑,打算认真学习一下正则,高深的不说,常见的元素能够匹配提取出来够用就可以,下面是自己学习正则特殊字符串的一些学习笔记。
1、.
.
是正则中最常用的特殊字符串,能够匹配任意字符。一个.
匹配一个字符。
2、*
*
通常跟在前一个字符串后面,代表出现多个同样的字符串,另外一种理解就是出现大于等于0次。
3、+
+
基本的用法和*
的差不多,区别在于+
代表的是至少出现一次,也就是说+
代表的是大于等于1。
4、[]
[]
在正则表达式中主要有三个作用,使用的地方也比较多。
[]
可以用来让字符串匹配[]
中出现的字符,以或的形式进行匹配。
[]
可以用来让字符串匹配[]
中出现的区间范围内的任意内容。
[]
中的^
可以匹配非XX的任意内容,这里的^
不同于稍后我们要说的特殊字符串^
。
5、^和$
^
是指要匹配的字符串以什么开头,$
是指要匹配的字符串以什么结尾。
6、?
?
是用来匹配非贪婪模式的,所谓的非贪婪是指最小匹配,比如有N个都满足,非贪婪模式只会匹配最先满足条件的。
7、|
|
可以理解为或操作,匹配的时候|
两边只要满足一个就可以匹配到,如果有多个条件的话,可以用多个|
隔开。
8、{}
{}
主要有三种具体的使用方法,下面分别介绍一下。{n}
,匹配前一个字符出现n次,属于=
操作{n,}
,匹配前一个字符至少n次,属于>=
操作{m,n}
匹配前一个字符最少m次,最多n次,属于>= & <=
操作
9、\s和\S
\s
和\S
是一对对立的特殊字符,其中\s
表示一个空格字符,\S
表示一个非空字符。
10、 \w和\W
\w
和\W
也是一对对立的特殊字符,\w
匹配包括下划线的任何单词字符。等价于"[A-Za-z0-9_]"。\W
匹配任何非单词字符。等价于 "[^A-Za-z0-9_]"。
11、\
\
是指转义符,如果字符串中有正则表达式中的特殊字符串,如果需要匹配的话,需要在特殊字符串前加\
。正则表达式基本的特殊字符串就差不多这么些,其他的使用的频率不是很高,暂时不打算学习,后面用到的时候再说。下一篇文章打算说说python中正则表达式该如何用,有哪些常见的函数及其用法、例子等。
以上是关于正则表达式特殊字符串学习笔记的主要内容,如果未能解决你的问题,请参考以下文章