python 匹配网页标签

Posted halfsmart

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 匹配网页标签相关的知识,希望对你有一定的参考价值。

在爬虫的时候需要匹配某一类型的标签,如果网页不是很复杂的话,可以使用下面的方法

import re

ret = re.search("<(?P<tag_name>w+)>w+</(?P=tag_name)>","<h1>hello</h1>")
#还可以在分组中利用?<name>的形式给分组起名字
#获取的匹配结果可以直接用group(‘名字‘)拿到对应的值
print(ret.group(‘tag_name‘))  #结果 :h1
print(ret.group())  #结果 :<h1>hello</h1>

以上是关于python 匹配网页标签的主要内容,如果未能解决你的问题,请参考以下文章

Python中verbaim标签使用详解

组件化网页开发 / 步骤一 · 4-4 匹配HTML标签

循环通过 python 正则表达式匹配

分享前端开发常用代码片段

java爬虫抓取指定数据

JSP基础