利用selenium进行爬虫时,防止js检测驱动的方法
Posted 只宅不技术
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用selenium进行爬虫时,防止js检测驱动的方法相关的知识,希望对你有一定的参考价值。
浏览器前端通常会做一下反爬虫的手段,如下
webdriver = window.navigator.webdriver; if(webdriver){ console.log(‘你这个傻逼你以为使用Selenium模拟浏览器就可以了?‘) } else { console.log(‘正常浏览器‘) }
如何利用爬虫针对js代码的反爬手段进行规避,以谷歌浏览器为例,进行设置,代码如下
from selenium import webdriver
option = webdriver.ChromeOptions() option.add_experimental_option(‘excludeSwitches‘, [‘enable-automation‘]) driver = webdriver.Chrome(options=option)
以上是关于利用selenium进行爬虫时,防止js检测驱动的方法的主要内容,如果未能解决你的问题,请参考以下文章
利用 selenium 的 webdrive 驱动 headless chrome
Selenium webdriver:修改 navigator.webdriver 标志以防止硒检测