Python爬虫五 BeautifulSoup库

Posted Leerep

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫五 BeautifulSoup库相关的知识,希望对你有一定的参考价值。

安装

pip install beautifulsoup4

小测

  1. 即使安装的是beautifulsoup4,但是使用时简写为bs4
  2. 从bs4库导入一个BeautifulSoup类,注意B和S大写
  3. html.parser为解析器,还有xml,lxml, html5lib等解析器

bs4基本元素

基于bs4的html遍历方式

下行遍历

上行遍历

平行遍历(发生在同一个父节点下的各个节点间)

以上是关于Python爬虫五 BeautifulSoup库的主要内容,如果未能解决你的问题,请参考以下文章

爬虫—— BeautifulSoup模块获取元素

Python编程基础之(五)Scrapy爬虫框架

Python_爬虫_BeautifulSoup网页解析库

Python爬虫利器:BeautifulSoup库

Python爬虫解析库之beautifulsoup

python爬虫(十九)BeautifulSoup4库