python教程入门学习正则表达式基本语法

Posted 梦子mengy7762

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python教程入门学习正则表达式基本语法相关的知识,希望对你有一定的参考价值。

正则表达式(regular expression)是一种字符串匹配模式或者规则,它可以用来检索、替换那些符合特定规则的文本。正则表达式几乎适用于所有编程语言,无论是前端语言 javascript,还是诸如许多后端语言,比如 Python、Java、C# 等,这些语言都提供了相应的函数、模块来支持正则表达式,比如 Python 的 re 模块就提供了正则表达式的常用方法。

在使用 Python 编写爬虫的过程中,re 模块通常做为一种解析方法来使用。通过审查网页元素来获取网页的大体结构,然后使用解析模块来提取你想要的网页信息,最终实现数据的抓取。本节对正则表达式基本语法做简单讲解。
注意:学习本节知识之前,您应该已经掌握了正则表达式的使用方法。

正则表达式元字符
下表列出了常用的正则表达式元字符:

  1. 元字符

正则表表达式元字符

  1. 量词

正则表达式量词

  1. 字符组
    有时也会出现各种字符组成的字符组,这在正则表达式中使用[]表示,最后,如果你的时间不是很紧张,并且又想快速的python提高,最重要的是不怕吃苦,建议你可以架群:【832357663】 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~
    如下所示:

正则表达式字符组

贪婪模式非贪婪模式
正则表达式默认为贪婪匹配,也就是尽可能多的向后匹配字符,比如 n,m 表示匹配前面的内容出现 n 到 m 次(n 小于 m),在贪婪模式下,首先以匹配 m 次为目标,而在非贪婪模式是尽可能少的向后匹配内容,也就是说匹配 n 次即可。在学习Python的道路上,经常会碰到许多的问题,而我们在一起问题就不是问题了,可以在小编找到冠一哒,一起学习,也可以私信“01”获取学习干货,碰到什么问题也可以及时来问小编哒。

贪婪模式转换为非贪婪模式的方法很简单,在元字符后添加“?”即可实现,如下所示:

正则表达式转义
如果使用正则表达式匹配特殊字符时,则需要在字符前加\\表示转意。常见的特殊字符如下:

    • ? ^ $ [] () | \\

以上是关于python教程入门学习正则表达式基本语法的主要内容,如果未能解决你的问题,请参考以下文章

python学习正则表达式入门

JavaScript代码-正则表达式基本语法入门

转--python之正则入门

正则表达式入门以及高阶学习教程

python3爬虫之入门和正则表达式

python爬虫入门