python爬虫lxml基本用法

Posted 2023-02-14

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python爬虫lxml基本用法相关的知识，希望对你有一定的参考价值。

参考技术A python3环境下安装命令

用lxml解析html，利用etree.HTML解析字符串将字符串解析从html格式的文件，经过处理后，部分缺失的节点可以自动修复，并且还自动添加了 body、html 节点

通过 / 或 // 即可查找元素的子节点或子孙节点。
选择 li 节点的所有直接 a 子节点xpath为：//li/a

标签[@属性=“”]

@text()

/@属性

[contains(@属性,"值")]

以上是关于python爬虫lxml基本用法的主要内容，如果未能解决你的问题，请参考以下文章

Python爬虫利器三之Xpath语法与lxml库的用法

Python爬虫：通过爬取CSDN博客信息，学习lxml库与XPath语法

python网络爬虫之LXML与HTMLParser

16.Python使用lxml爬虫

Python爬虫基础之lxml