Python-bs4解析html

Posted python-lll

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python-bs4解析html相关的知识,希望对你有一定的参考价值。

Beautiful Soup简介(简称bs4)

它是一个可以从HTML或XML文件中提取数据的Python库,它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式,节省工作时间

 所有对象可以归纳为4种:

Tag:标签对象,例如<p class=”title”><b>yoyoketang</b></p>,这就是一个标签

NavigableString:字符对象,如:这里是我的微信公众号:yoyoketagn

BeautifulSoup:就是整个html对象

Comment:注释对象,如:!-- for HTML5 --,它其实就是一个特殊NavigableString

安装pip install beautifulsoup4

 

以上是关于Python-bs4解析html的主要内容,如果未能解决你的问题,请参考以下文章

解析 HTML Python,BeautifulSoup

Python 垃圾回收机制与原理解析

xml.dom 二

算法--归并排序

算法--归并排序

如何检查我导入的数据中的单元格是不是包含 0 html python