python步骤四 第一课初始正则表达式

Posted 喵了个喵0507

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python步骤四 第一课初始正则表达式相关的知识,希望对你有一定的参考价值。

第一课、初始正则表达式

一、课程介绍

  1.1 课程概要

  步骤介绍

  • 正则表达式入门及应用
  • 正则的进阶
  • 案例
  • 综合项目实战

 

二、正则表达式的基本操作(多敲代码多做练习)

  2.1 什么是正则表达式

  什么是正则表达式

  • 正则表达式(简称为regex)是一些有字符和特殊符号组成的字符串
  • 能按照某种模式匹配一系列有相似特征的字符串          例如:[a-z]表示26个小写英文字母

  正则表达式中的符号

符号 描述 示例
literal 匹配文本字符串的字面值literal foo
re1|re2 匹配正则表达式re1或者re2 foo|bar
. 匹配任何字符(除了 之外) b.b
^ 匹配字符串起始部分 ^Dear
$ 匹配字符串终止部分 /bin/*sh$
* 匹配0次或者多次前面出现的正则表达式 [A-Za-z0-9]*
+ 匹配1次或者多次前面出现的正则表达式 [a-z]+.com
? 匹配0次或者1次前面出现的正则表达式 goo?
{N} 匹配N次前面出现的正则表达式 [0-9]{3}
{M,N} 匹配M~N次前面出现的正则表达式 [0-9]{5,9}
[...] 匹配来自字符集的任意单一字符 [aeiou]
[..x-y..] 匹配x~y范围中的任意单一字符 [0-9][A-Za-z]
[^...] 不匹配此字符集中出现的任何一个字符,包括某一范围的字符(如果在此字符集中出现) [^aeiou],[^A-Za-z0-9]
(*|+|?|{})? 用于匹配上面频繁出现/重复出现符号的非贪婪版本(*、+、?、{}) *?[a-z]
(...) 匹配封闭的正则表达式,然后另存为子组 ([0-9]{3})?,f(oo|u)bar

 

 

 

 

 

 

 

 

 

 

 

  正则表达式中的特殊字符

特殊字符 描述 示例
d 匹配任何十进制数字,与[0-9]一致(D与d相反,不匹配任何非数值型的数字)  
w 匹配任何字母数字字符,与[A-Za-z0-9]相同(W与之相反)  
s 匹配任何空格字符,与[ vf]相同(S与之相反)  
 匹配任何单词边界(B与之相反)  
N 匹配已保存的子组N(参见上面的(...))  
c 逐字匹配任何特殊字符c(即,)  
A()    

以上是关于python步骤四 第一课初始正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

第一章:正则表达式

40 python 正则表达式 match方法匹配字符串 使用search函数在一个字符串中查找子字

互联网金融爬虫怎么写-第二课 雪球网股票爬虫(正则表达式入门)

互联网金融爬虫怎么写-第二课 雪球网股票爬虫(正则表达式入门)

从零开始学Python爬虫(四):正则表达式

python常用模块之——正则re模块