Selenium-Selenium配置无头浏览器+规避检测

Posted Devops代哲

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Selenium-Selenium配置无头浏览器+规避检测相关的知识,希望对你有一定的参考价值。

一、谷歌无头浏览器

image

from selenium import webdriver
from selenium.webdriver.chrome.options import Options

# 创建一个参数对象,用来控制chrome以无界面模式打开
chrome_options = Options()
chrome_options.add_argument(\'--headless\')
chrome_options.add_argument(\'--disable=gpu\')

# 创建浏览器对象
browser = webdriver.Chrome(chrome_options=chrome_options)

# 访问测试
browser.get(\'https://www.baidu.com\')
print(browser.page_source)

二、Selenium规避检测

  • 现在不少网站有对 Selenium采取了检测机制,比如正常情况下我们用浏览器访问某宝的 windows.navigator.webdirver 的值为 undefind,而使用 selenium访问的值为true,那么如何规避呢?
  • 只需要奢侈 Chromedriver的启动参数即可。在启动Chromedriver之前,将Chrom开启验证性功能参数 excludeSwitches,它的值为 [\'enable-automation\']

image

from selenium import webdriver
# 实现无可视化界面
from selenium.webdriver.chrome.options import Options
# 实现规避检测
from selenium.webdriver import ChromeOptions

# 创建一个参数对象,用来控制chrome以无界面模式打开
chrome_options = Options()
chrome_options.add_argument(\'--headless\')
chrome_options.add_argument(\'--disable=gpu\')

# 创建浏览器对象,并实现让selenium 规避检测
option = ChromeOptions()
option.add_experimental_option(\'excludeSwitched\', [\'enable-automaytion\'])

browser = webdriver.Chrome(chrome_options=chrome_options, options=option)

# 访问测试
browser.get(\'https://www.baidu.com\')
print(browser.page_source)

以上是关于Selenium-Selenium配置无头浏览器+规避检测的主要内容,如果未能解决你的问题,请参考以下文章

Selenium-Selenium处理iframe处理及动作链

爬虫使用无头浏览器

如何运行无头的selenium脚本,独立于主机和浏览器

在无头浏览器中运行polymer-3.x测试

如何使用 Next.js 将 Wordpress 配置为无头 CMS

无头浏览器是啥?它有啥用?