selenium淘宝阿里妈妈分析

Posted xxzblog

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了selenium淘宝阿里妈妈分析相关的知识,希望对你有一定的参考价值。

selenium启动参数配置

List<String> list = new ArrayList<>();
// 无界面浏览器
// list.add("--headless");
list.add("--disable-gpu");
list.add("--no-sandbox");
list.add("--disable-dev-shm-usage");
list.add("--disable-cache");
// 禁止window.navigator.webdriver检测
list.add("--disable-blink-features");
list.add("--disable-blink-features=AutomationControlled");
options.addArguments(list.toArray(new String[0]));

// 开启代理
Proxy proxy = new Proxy();
proxy.setProxyAutoconfigUrl("http://127.0.0.1:" + System.getProperty("httpServer.port") + "/pac");
options.setProxy(proxy);

options.setExperimentalOption("excludeSwitches", Arrays.asList("enable-automation"));
options.setExperimentalOption("useAutomationExtension", false);
options.setCapability("acceptSslCerts", true);
options.setCapability("takesScreenshot", true);
options.setCapability("cssSelectorsEnabled", true);
options.setCapability(CapabilityType.UNEXPECTED_ALERT_BEHAVIOUR, UnexpectedAlertBehaviour.IGNORE);

执行javascript

JavascriptExecutor jse = (JavascriptExecutor) driver;
jse.executeScript(js);

淘宝H5发请求核心代码

window.lib.mtop.H5Request(
AntiCreep: true, /* 防爬 */
AntiFlood: true, /* 防ddos */
api: 'mtop.alimama.moon.provider.edetail.iteminfo.get',
data: url: 'https://detail.taobao.com/item.htm?id=' + itemId, extendParam:'',
ecode: '0',
timeout: 20000,
type: 'GET',
v: '1.0'
, function (data) , function (error) 
);

以上是关于selenium淘宝阿里妈妈分析的主要内容,如果未能解决你的问题,请参考以下文章

阿里大变局,马云女弟子掌舵淘宝

戴珊接替蒋凡,掌管淘宝天猫,阿里太子已被废?

屏蔽全部统计代码(51.la cnzz 百度统计 谷歌分析师adsense屏蔽淘宝客广告代码)的方法

selenium+chrome抓取淘宝宝贝-崔庆才思路

使用Selenium模拟浏览器抓取淘宝商品美食信息

爬虫实战Selenium解析淘宝宝贝-获取宝贝信息并保存