爬虫---解析
Posted GAO6
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫---解析相关的知识,希望对你有一定的参考价值。
1.beautifulsoup
https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
pip install beautifulsoup4
1.1 解析库
建议lxml
1.2 解析
四个对象:
# 四种对象:Tag , NavigableString , BeautifulSoup , Comment .
tag对象的:string。gettext()。content。
遍历tag对象
head_tag.descendants:子孙节点
title_tag.children:子节点
寻找tag对象
soup.find_all(re.compile("t")):
soup.find_all(["a", "b"])
2.xpath
3.pyquery
4.正则表达式
以上是关于爬虫---解析的主要内容,如果未能解决你的问题,请参考以下文章
片段(Java) | 机试题+算法思路+考点+代码解析 2023