lxml解析库的安装和使用

Posted xuyingzhong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了lxml解析库的安装和使用相关的知识,希望对你有一定的参考价值。

一、lxml的安装
lxml是Python的一个解析库,支持html和XML的解析,支持XPath解析方式,而且解析效率非常高。本节中,我们了解一下lxml的安装方式,这主要从Windows、Linux和Mac三大平台来介绍。
官方网站:http://lxml.de
GitHub:https://github.com/lxml/lxml
PyPI:https://pypi.python.org/pypi/lxml

在Windows下,可以先尝试利用pip安装,此时直接执行如下命令即可:

pip3 install lxml

如果出现报错,比如提示缺少libxml2库等信息,可以采用wheel方式安装。
推荐直接到这里(链接为:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)下载对应的wheel文件,找到本地安装Python版本和系统对应的lxml版本,例如Windows 64位、Python 3.6,就选择lxml?4.2.3?cp36?cp36m?win_amd64.whl,将其下载到本地。
然后利用pip安装即可,命令如下:

pip3 install 路径/lxml?4.2.3?cp36?cp36m?win_amd64.wh

在Linux平台下安装问题不大,同样可以先尝试pip安装,命令如下:
pip3 install lxml
如果报错,可以尝试下面的解决方案。

CentOS、Red Hat
执行如下命令安装所需的库即可:

sudo yum groupinstall -y development tools
sudo yum install -y epel-release libxslt-devel libxml2-devel openssl-devel

主要是libxslt-devel和libxml2-devel这两个库,lxml依赖它们。安装好之后,重新尝试pip安装即可。

Ubuntu、Debian和Deepin
在这些系统下,报错的原因同样可能是缺少了必要的类库,执行如下命令安装:

sudo apt-get install -y python3-dev build-essential libssl-dev libffi-dev libxml2 libxml2-dev libxslt1-dev zlib1g-dev

安装好之后,重新尝试pip安装即可。

Python命令行下测试:

>>> import lxml #不报错即可











以上是关于lxml解析库的安装和使用的主要内容,如果未能解决你的问题,请参考以下文章

Python操作XML和HTML,LXML类库的使用

python怎么安装lxml html 解析器

Lxml

ubuntu下的python网页解析库的安装——lxml, Beautiful Soup, pyquery, tesserocr

Xpath语法与lxml库的用法

Windows环境下使用pip install安装lxml库