re模块和分组

Posted laogao123

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了re模块和分组相关的知识,希望对你有一定的参考价值。

1.   findall     search      match     (查找,匹配)

    findall方法括号内参数 正则,字符串, 返回值是一个列表,匹配不到返回[] 空列表

           如   ===>    ret = re.findall(‘s+‘,‘kjewhfqho254qfewgf‘)               print(ret)

    search 方法括号内参数 正则,字符串, 匹配到返回值是对象空间,,没有匹配到则返回None,  也经常用到if 语句中,如if ret1:print(ret1.group()) # 返回的对象通过group来获                             取匹配到的第一个结果

           如   ===>    ret1 = re.search(‘d‘,‘dg;ijwpggg.weqge‘) print(ret1)

    match与search方法相类似,区别在于相当于在正则的开头加了了^ ,用来判断以什么开始的,不建议用

            如   ===>    ret2 = re.match(‘d+‘,‘afw321653afdwqef‘)              print(ret2.group()) 

2.     sub    subn  (替换)              split   (切割)

    sub方法,括号内 正则,替换的新值,字符串,替换次数(多少不会报错),返回值是字符串类型

    subn 跟sub一样,除了会返回替换后的结果,还会返回替换的次数,是元组类型

            如   ===>   ret3 = re.sub(‘d+‘,‘H‘,‘53463434dweqf53we1gfw5f‘)       print(ret3) 

     split切割方法括号内 正则,字符串 返回值是个列表,     注意:   处理数据时,如果被切割的也显示出来,那就给正则那里加个括号(),这样就能显示出来

            如     ===>   ret4 = re.split(‘d+‘,‘wegwerwg2564gfwe3g156‘) print(ret4) 

3        ret5 = re.compile(‘-0.d+|-[1-9]+(.d+)?‘) # 多次用到这个正则表达式时,那么就用compile 命令节省时间效率

          res = ret5.search(‘fgqgioh521-4551312qgwfgqwfge‘)# 只用传字符串就行

          print(res.group())

     ret0 = re.finditer(‘d+‘,‘kfhqhegf564646.weg545-we5g4‘) #注意这个命令会帮我们拿到符合正则的字符串的迭代器,节省空间

     for r in ret0:

        print(r.group())

4,   findall   会优先显示分组中的内容,要想取得分组优先,   (?:正则表达式) 正则前面加?:

     split 遇到分组 会保留分组内被切掉的内容

     search 如果search中有分组的话,通过group(n)就能够拿到group中的匹配的内容

5,  分组的命名

     启名字

    (?P<name>正则表达式) 表示给分组起名字

     通过索引使用分组

    (?P=name)表示使用这个分组,这里匹配到的内容应该和分组中的内容完全相同

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   

 

以上是关于re模块和分组的主要内容,如果未能解决你的问题,请参考以下文章

re模块和分组

转义符,re模块,rangdom随机数模块,

re模块,分组在re模块中的使用,使用正则表达式的技巧,爬虫实例

re 模块

re模块中常用的函数及分组

Python高级详解 正则表达式(re模块)