scrapy基础知识之随机切换fake-useragent 库的使用:

Posted hcw_19

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scrapy基础知识之随机切换fake-useragent 库的使用:相关的知识,希望对你有一定的参考价值。

pip install fake-useragent
from fake_useragent import UserAgent
ua = UserAgent()

middlewares.py
技术分享
 1 from fake_useragent import UserAgent
 2 
 3 class RandomUserAgent(object):
 4     # def __init__(self,crawl):
 5     #     super(RandomUserAgent,self).__init__()
 6     #     self.ua=UserAgent()
 7     def process_request(self, request, spider):
 8         #useragent = random.choice(USER_AGENTS)
 9         ua=UserAgent()
10         request.headers.setdefault("User-Agent",ua.random)
View Code

settints.py

技术分享
1 DOWNLOADER_MIDDLEWARES = {
2       LaGou.middlewares.RandomUserAgent: 1,
3 #    ‘LaGou.middlewares.MyCustomDownloaderMiddleware‘: 543,
4 }
View Code

 更多访问地址:https://github.com/hellysmile/fake-useragent




以上是关于scrapy基础知识之随机切换fake-useragent 库的使用:的主要内容,如果未能解决你的问题,请参考以下文章

scrapy基础知识之防止爬虫被反的几个策略::

scrapy基础知识之下载中间件使用案例:

scrapy基础知识之 Scrapy 和 scrapy-redis的区别:

scrapy基础知识之 scrapy 三种模拟登录策略:

Scrapy基础一 ------学习Scrapy之前所要了解的

scrapy基础知识之 Scrapy-Redis分布式策略: