Python——XPath使用

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python——XPath使用相关的知识,希望对你有一定的参考价值。

一:XPath介绍

XPath全称XML路径语言,用于确定XML文档中某部分位置。XPath基于XML树状结构,在树中寻找结点。

现在,一般使用XPath在XML中查找、提取信息,同时,它也支持HTML。所以,我们可以用XPath取代正则表达式来提取信息。

XPath通过元素以及属性进行导航。

 

二:XPath使用大概步骤

1:安装lxml模块

2:导入树形结构

from lxml import etree

3:把requests抓取的网页转化为树形结构

selector=etree.HTML(网页源码)

4:从树形结构中查找信息

selector.xpath(查找条件)

 

三:代码实战

 

以上是关于Python——XPath使用的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(46):使用Chrome验证XPath

Python使用Xpath轻松爬虫(脑残式)

XPath 歧义

使用lxml的Python脚本,xpath返回空列表

Python爬虫 解析 xpath -- Xpath Helper插件的安装xpath的基本使用

使用xpath(python3)的href属性为空