BeautifulSoup

Posted 明月十四桥

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了BeautifulSoup相关的知识,希望对你有一定的参考价值。

一、强大的BeautifulSoup:BeautifulSoup是一个可以从html或xml文件中提取数据的Python库。它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式。在Python开发中,主要用的是BeautifulSoup的查找提取功能,修改功能很少使用

1、安装BeautifulSoup

pip3 install beautifulsoup4

2、安装第三方html解析器lxml

pip3 install lxml

3、安装纯Python实现的html5lib解析器

pip3 install html5lib

 

二、BeautifulSoup的使用:

1、导入bs4库

from bs4 import BeautifulSoup #导入bs4库

2、创建包含html代码的字符串

html_str = """

<html><head><title>The Dormouse\'s story</title></head>

<body>

<p class="title"><b>The Dormouse\'s stopy</b></p>

<p class="story">Once upon a time there were three little sisters;and their names where

<a href="http://example.com/elsie" class="sister" id="link1"><!-

以上是关于BeautifulSoup的主要内容,如果未能解决你的问题,请参考以下文章