Python-bs4解析html
Posted python-lll
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python-bs4解析html相关的知识,希望对你有一定的参考价值。
Beautiful Soup简介(简称bs4)
它是一个可以从HTML或XML文件中提取数据的Python库,它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式,节省工作时间
所有对象可以归纳为4种:
Tag:标签对象,例如<p class=”title”><b>yoyoketang</b></p>,这就是一个标签
NavigableString:字符对象,如:这里是我的微信公众号:yoyoketagn
BeautifulSoup:就是整个html对象
Comment:注释对象,如:!-- for HTML5 --,它其实就是一个特殊NavigableString
安装pip install beautifulsoup4
以上是关于Python-bs4解析html的主要内容,如果未能解决你的问题,请参考以下文章