利用selenium进行爬虫时,防止js检测驱动的方法

Posted 只宅不技术

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用selenium进行爬虫时,防止js检测驱动的方法相关的知识,希望对你有一定的参考价值。

浏览器前端通常会做一下反爬虫的手段,如下

webdriver = window.navigator.webdriver;
if(webdriver){    
console.log(‘你这个傻逼你以为使用Selenium模拟浏览器就可以了?‘)
} else {    
console.log(‘正常浏览器‘)
}

如何利用爬虫针对js代码的反爬手段进行规避,以谷歌浏览器为例,进行设置,代码如下

from selenium import webdriver
option = webdriver.ChromeOptions() option.add_experimental_option(excludeSwitches, [enable-automation]) driver = webdriver.Chrome(options=option)

以上是关于利用selenium进行爬虫时,防止js检测驱动的方法的主要内容,如果未能解决你的问题,请参考以下文章

利用 selenium 的 webdrive 驱动 headless chrome

Selenium webdriver:修改 navigator.webdriver 标志以防止硒检测

Python爬虫 -- Selenium库的使用

Python爬虫 -- Selenium库的使用

c#爬虫-selenium检测webdriver封爬虫的解决方法

selenium模块在爬虫中的应用