关于爬虫的正则表达式一点记录

Posted crayszhangblog

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关于爬虫的正则表达式一点记录相关的知识,希望对你有一定的参考价值。

今天再爬虫的正则表达式里纠结了很久,记录下来,防止忘记再浪费时间

 content = requests.get(url)
        
 m=re.findall(r<a href="([0-9a-zA-Z\_/.\%?=-&]+)",content.text,re.I)

一开始,我把content变成str(content)放在正则匹配式中,无法匹配,可能是因为str(content)是空的。

 

所以一定要用content.text来匹配

以上是关于关于爬虫的正则表达式一点记录的主要内容,如果未能解决你的问题,请参考以下文章

关于python爬虫经常要用到的一些Re.正则表达式

python爬虫学习记录基本库的使用——正则表达式

正则表达式

关于爬虫解析数据的4种方式

爬虫之正则表达式的应用爬取

常用正则表达式最强汇总(含Python代码举例讲解+爬虫实战)