BeautifulSoup库

Posted wangshx6

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了BeautifulSoup库相关的知识,希望对你有一定的参考价值。


1.BeautifulSoup支持的解析器:

  • python标准库:BeautifulSoup(markup, "html.parser") 执行速度适中,文档容错能力强
  • lxml HTML解析器:BeautifulSoup(markup, "lxml") 执行速度适快,文档容错能力强
  • lxml XML解析器:BeautifulSoup(markup, "xml") 执行速度适快,唯一支持XML的解析器
  • html5lib解析器:BeautifulSoup(markup, "html5lib") 最好的容错性、以浏览器的方式解析文档、生成html5格式的文档

2.find_all 返回所有查找到的元素

3.find 返回单个元素

4.CSS选择器:

  • select() 直接传入CSS选择器
  • get_text() 获取文本

以上是关于BeautifulSoup库的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫之BeautifulSoup

python爬虫之解析库Beautiful Soup

Python爬虫编程思想(49):Beautiful Soup环境搭建

ImportError:无法导入名称“BeautifulSoup4”

Python BeautifulSoup库使用

爬虫基础库 — beautifulsoup