利用selenium自动抓取淘宝后台运营数据填入表格

Posted 御前吹水

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用selenium自动抓取淘宝后台运营数据填入表格相关的知识,希望对你有一定的参考价值。

在下帮别人写的简单python程序。我很懒,有时间再写博客,先放github链接

使用说明:

一.电脑环境配置

电脑:windows系统;

浏览器:谷歌,建议版本 95.0.4638.69(如果其他版本的浏览器,大概率会出错;95开头亦可)

浏览器资源:根文件夹下有谷歌浏览器安装文件,可自行解压安装

表格命名:初始表格命名必须一字不差“springLoveShi.xls”或“springLoveShi. xlsx”,并把压缩文件夹里原来命名为这个文件的表格文件删除,将需要提取身份证的文件拖入文件夹

表格模板:模板第1列必须是订单编号,第9列必须是身份证号

温馨提示:开始时请不要运行谷歌浏览器;第一行作为表头最好都要有值,第一行第一列需为空。

开始时请不要运行谷歌浏览器

  • 操作说明

打开springLoveShiLoveShi.exe文件,点击运行

  1. 输入目标浏览器位置

运行程序的第一步需要输入谷歌浏览器启动文件的位置。下面是寻找谷歌浏览器的位置的方法:

    1. 右键单击谷歌浏览器图标,然后点击属性

    1. 然后点击上方的快捷方式,复制目标框里的值到一开始的提示框里就行了

  1. 登录

不出意外的话,谷歌浏览器会跳转到淘宝登录页面

同时,提示框里会提示“登录后回到该窗口点击Enter键”

那登录后不要做任何事情,回到提示框点击enter就好。

  1. 看到提示框有成功提示后,可以发现根文件夹下多了一个身份证号码提取.xlsx的文件,那个就是我们需要的文件了(如果本来存在,那么原来的最终文件会被覆盖)。

以上是关于利用selenium自动抓取淘宝后台运营数据填入表格的主要内容,如果未能解决你的问题,请参考以下文章

利用 selenium 抓取 淘宝信息

使用Selenium模拟浏览器抓取淘宝商品美食信息

Selenium+Chrome抓取淘宝数据

使用selenium模拟浏览器抓取淘宝信息

利用selenium自动化登录淘宝

使用selenium抓取淘宝的商品信息