xpath学习,通过xpath 采集数据

Posted la634

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了xpath学习,通过xpath 采集数据相关的知识,希望对你有一定的参考价值。

通过上一篇文章我们已经知道如何通过xpah精准定位到网页中的某个元素了。今天再来看看昨天在网页中获取的数据该怎么办?

一、打开模板测试工具

二、双击run.bat

   在执行这一步时我们必须安装Java环境,即成功安装和配置jdk环境

技术分享图片

 

ps:工具为公司内部使用,市面上无法找到该软件。

上图界面中点击新建站点模板即可,

三、开始配置站点模板

技术分享图片

 

1.上图中第一栏为网站首页中去除www和斜杠即后面的内容,第二栏为网页的中文名字,之后两栏大家不要管他

 倒数第三栏为网站编码方式,可以通过F12查找。最后两栏为国家和语言,这里均以网站上为标准。而且语言中

必须时以“文”字结尾。上图填写好了之后我们就可以添加z子模块了。

2.进入之后我们就可以开始添加频道消息了

技术分享图片

技术分享图片

配置成功界面如下

技术分享图片

 

 技术分享图片

 

 如此之后就可以发布了,发布之后不要关闭窗口,我们在发布之后可以将保存在我们硬盘中的文件拖到窗口中

测试站点是否成功。如果站点配置无误我们即可关闭窗口。

 

以上是关于xpath学习,通过xpath 采集数据的主要内容,如果未能解决你的问题,请参考以下文章

Requests和Xpath笔趣阁小说采集爬取教程

XPath|掌握数据采集工具的核心技巧

xpath 语法

python网络数据采集之xpath

Python爬虫:通过爬取CSDN博客信息,学习lxml库与XPath语法

Python爬虫:通过爬取CSDN博客信息,学习lxml库与XPath语法