python3解析库Beautiful Soup的安装教程详解
Posted zhi_neng
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python3解析库Beautiful Soup的安装教程详解相关的知识,希望对你有一定的参考价值。
Beautiful Soup是Python的一个 html或 XML 的解析库,我们可以用它来方便地从网页中提取数据。它拥有强大的API和多样的解析方式,本节就来了解下它的安装方式。
1.相关链接
官方文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc
中文文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh
PyPI:https://pypi.python.org/pypi/beautifulsoup4
2.准备工作
Beautiful Soup的HTML和XML解析器是依赖于lxml库的,所以在此之前请确保已经成功安装好了lxml库,具体的安装方式参见上节。
3.pip 安装
目前Beautiful Soup 的最新版本是 4.9.3版本,之前的版本已经停止开发了。这里推荐使用pip来安装,安装命令如下:
pip3 install beautifulsoup4
命令执行完毕之后即可完成安装。
4. wheel 安装
当然,我们也可以从PyPI下载wheel文件安装,链接如下:
https://pypi.python.org/pypi/beautifulsoup4
然后使用pip 安装 wheel 文件即可。
5.验证安装
安装完成之后,可以运行下面的代码验证一下:
from bs4 import BeautifulSoup
soup=BeautifulSoup('<p>Helloc</p>','lxml')
print(soup.p.string)
运行结果如下:hello
如果运行结果一致,则证明安装成功。
注意,这里我们虽然安装的是beautifulsoup4这个包,但是在引入的时候确实bs4.这是因为这个包源代码本身的库文件夹名称就是bs4,所以安装完成之后,这个库文件夹就被移入到本机Python3的lib库里,所以识别到的库文件名就叫作bs4。
因此,包本身的名称和我们使用时导入的包的名称并不一定是一致的,注意这一点。
以上是关于python3解析库Beautiful Soup的安装教程详解的主要内容,如果未能解决你的问题,请参考以下文章
python3解析库Beautiful Soup的安装教程详解
[Python3网络爬虫开发实战] 1.3.2-Beautiful Soup的安装