Python 抓取网页tag操作

Posted 2020-11-23 华小电

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python 抓取网页tag操作相关的知识，希望对你有一定的参考价值。

1. 获取操作tag

获取操作tag的接种方式：

soup.find_all(name=None, attrs={}, recursive=True, text=None, limit=None, **kwargs)，返回符合条件的所有标签，查找不到则返回[]，可以传递标签名，标签属性，关键字参数，函数，True等
soup.find(name=None, attrs={}, recursive=True, text=None, **kwargs)，返回第一个符合条件的标签，查找不到则返回None
soup.select(selector, _candidate_generator=None, limit=None)，根据css选择器返回所有符合条件的标签
soup.select_one(selector),返回符合css选择器的第一个标签

2. 操作tag

tag.name ，获取标签名，例如：‘div‘
tag[‘attr_name‘] ，获取标签的某个属性的值，string类型
tag[‘class‘] ，获取标签的class属性值，list类型，例如：[‘orange‘, ‘login‘]
tag.attrs ，获取标签的所有属性，dict类型
tag.get_text() ，返回标签的内容，或者 tag.text

以上是关于Python 抓取网页tag操作的主要内容，如果未能解决你的问题，请参考以下文章