BeautifulSoup
Posted 明月十四桥
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了BeautifulSoup相关的知识,希望对你有一定的参考价值。
一、强大的BeautifulSoup:BeautifulSoup是一个可以从html或xml文件中提取数据的Python库。它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式。在Python开发中,主要用的是BeautifulSoup的查找提取功能,修改功能很少使用
1、安装BeautifulSoup
pip3 install beautifulsoup4
2、安装第三方html解析器lxml
pip3 install lxml
3、安装纯Python实现的html5lib解析器
pip3 install html5lib
1、导入bs4库
from bs4 import BeautifulSoup #导入bs4库
2、创建包含html代码的字符串
html_str = """
<html><head><title>The Dormouse\'s story</title></head>
<body>
<p class="title"><b>The Dormouse\'s stopy</b></p>
<p class="story">Once upon a time there were three little sisters;and their names where
<a href="http://example.com/elsie" class="sister" id="link1"><!-
以上是关于BeautifulSoup的主要内容,如果未能解决你的问题,请参考以下文章