XPath helper

Posted tinghai8

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了XPath helper相关的知识,希望对你有一定的参考价值。

26.1  XPath helper

26.1.1 XPath helper 插件概述

xPath helper 是一款 Chrome 浏览器的开发者插件,安装了 xPath helper 后就能轻松获取 html元素的 xPath,程序员就再也不需要通过搜索 html 源代码,定位一些 id 去找到对应的位置去解析网页了。

26.1.2  XPath helper插件功能介绍

Google 插件 XPath Helper 可以支持在网页点击元素生成 xpath,整个抓取使用了 xpath、正则表达式、消息中间件、多线程调度框架(参考)。xpath 是一种结构化网页元素选择器,支持列表和单节点数据获取,他的好处可以支持规整网页数据抓取。

如果我们要查找某一个、或者某一块元素的 xpath 路径,可以按住 shift,并移动到这一块中,上面的框就会显示这个元素的 xpath 路径,右边则会显示解析出的文本内容,并且我们可以自己改动 xpath 路径,程序也会自动的显示对应的位置,可以很方便的帮助我们判断我们的 xpath 语句是否书写正确。

26.1.3  XPath helper 插件下载

你可以从 chrome 应用商店里找到 chrome 爬虫插件,如果你的 chrome 应用商店无法打开,你可以从我的网盘(对应书的配套工具)里获取(xpath-helper.crx)。

 技术分享图片

26.1.4  XPath helper 插件安装

1. 如果你能够打开 chrome 应用商店,并且可以找到 chrome 爬虫插件,那么直接点击“添加至 chrome”,如下图所示:

 技术分享图片

2 . 如果你的 chrome 应用商店无法打开,你从我的网盘或者其他途径获得了chrome 爬虫插件,那么就选择离线安装该插件。由于 chrome 爬虫插件同其他 chrome 插件一样都是 CRX格式的,具体的安装方法如下:

1)在 chrome 中新开一个窗口,输入:chrome://extensions/ 回车,打开应用管理器。

 技术分享图片

2)把 crx 文件拖到应用管理器界面里,松开鼠标,会弹出安装提示,点击确定安装就可以了。

 技术分享图片

技术分享图片

3)重新启动浏览器,ctrl+shift+x 即可使用。

下面以腾讯社招网职位信息为例介绍一下:

https://hr.tencent.com/position.php?&start=0

技术分享图片

技术分享图片

 

 

 

以上是关于XPath helper的主要内容,如果未能解决你的问题,请参考以下文章

Python解析库lxml与xpath用法总结

xpath定位器

xPath 用法总结整理

xpath语法

Xpath()语法

如何获取元素的 xPath,并再次从 xPath 检索元素