Python爬虫编程思想(46):使用Chrome验证XPath

Posted 蒙娜丽宁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(46):使用Chrome验证XPath相关的知识,希望对你有一定的参考价值。

        验证XPath代码是否正确,并不一定要使用lxml以及其他解析库,直接使用Chrome浏览器的开发者工具就可以搞定。

        仍然拿京东商城为例,显示首页的开发者工具,然后定位到首页导航条的“秒杀”代码的位置,并安装上一节的方法复制该位置的XPath代码。然后在开发者工具中切换到Console选项卡,并输入如下的代码:

$x('//*[@id="navitems-group1"]/li[1]/a')

        其中$x是用来运行XPath的函数,参数需要指定XPath代码。如果XPath代码中包含的是双引号,参数要使用单引号括起来,如果XPath代码中包含的单引号,参数要使用双引号括起来。输入完成后,按Enter键,如果XPath可以至少选择一个节点,那么在下方就是显示这些节点,展开节点后,会看到节点中的各种属性的值,如图1所示。

         上面的XPath代码用于选择包含“秒杀”文本的<a>节点。从图1所示的选择结果可以看出,“秒杀”文本在<a>节点的innerhtml属性和innerText属性中。读者在编写或得到一行XPath代码时,可以用这种方式验证XPath代码是否正确。

以上是关于Python爬虫编程思想(46):使用Chrome验证XPath的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(60): 通过浏览器获取CSS选择器代码

Python爬虫编程思想(62): 项目实战:抓取酷狗网络红歌榜

Python爬虫编程思想(62): 项目实战:抓取酷狗网络红歌榜

Python爬虫编程思想(12):搭建代理与使用代理

Python爬虫编程思想(135):多线程和多进程爬虫--Python与线程

Python爬虫编程思想(135):多线程和多进程爬虫--Python与线程