利用selenium自动抓取淘宝后台运营数据填入表格
Posted 御前吹水
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用selenium自动抓取淘宝后台运营数据填入表格相关的知识,希望对你有一定的参考价值。
在下帮别人写的简单python程序。我很懒,有时间再写博客,先放github链接吧
使用说明:
一.电脑环境配置
电脑:windows系统;
浏览器:谷歌,建议版本 95.0.4638.69(如果其他版本的浏览器,大概率会出错;95开头亦可)
浏览器资源:根文件夹下有谷歌浏览器安装文件,可自行解压安装
表格命名:初始表格命名必须一字不差“springLoveShi.xls”或“springLoveShi. xlsx”,并把压缩文件夹里原来命名为这个文件的表格文件删除,将需要提取身份证的文件拖入文件夹
表格模板:模板第1列必须是订单编号,第9列必须是身份证号
温馨提示:开始时请不要运行谷歌浏览器;第一行作为表头最好都要有值,第一行第一列需为空。
开始时请不要运行谷歌浏览器
- 操作说明
打开springLoveShiLoveShi.exe文件,点击运行
- 输入目标浏览器位置
运行程序的第一步需要输入谷歌浏览器启动文件的位置。下面是寻找谷歌浏览器的位置的方法:
-
- 右键单击谷歌浏览器图标,然后点击属性
-
- 然后点击上方的快捷方式,复制目标框里的值到一开始的提示框里就行了
- 登录
不出意外的话,谷歌浏览器会跳转到淘宝登录页面
同时,提示框里会提示“登录后回到该窗口点击Enter键”
那登录后不要做任何事情,回到提示框点击enter就好。
- 看到提示框有成功提示后,可以发现根文件夹下多了一个身份证号码提取.xlsx的文件,那个就是我们需要的文件了(如果本来存在,那么原来的最终文件会被覆盖)。
以上是关于利用selenium自动抓取淘宝后台运营数据填入表格的主要内容,如果未能解决你的问题,请参考以下文章