Scrapy selenium 设置头部信息headers-------UA

Posted 那时的吻狠陶醉

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Scrapy selenium 设置头部信息headers-------UA相关的知识,希望对你有一定的参考价值。

1,PhantomJS

from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
from selenium import webdriver
dcap = dict(DesiredCapabilities.PHANTOMJS)
dcap[‘phantomjs.page.settings.userAgent‘] = ‘Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/62.0.3202.75 Safari/537.36‘
browser = webdriver.PhantomJS(desired_capabilities=dcap)
browser.save_screenshot(‘ctrip.png‘)(你可以截图下来看看你是不是正常访问页面数据)

2,Chrome

将上面的PhantomJS替换掉就可以。

以上是关于Scrapy selenium 设置头部信息headers-------UA的主要内容,如果未能解决你的问题,请参考以下文章

scrapy+selenium 爬取淘宝商城商品数据存入到mongo中

scrapy selenium 设置chromedriver不加载图片

Scrapy实战---Scrapy对接selenium爬取京东商城商品数据

scrapy--selenium

scrapy中间件中使用selenium切换ip

在无头模式下使用 Firefox 改进 scrapy 和 selenium