python爬虫 ProxyHandler处理器

Posted zhaoxinhui

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫 ProxyHandler处理器相关的知识,希望对你有一定的参考价值。

ProxyHandler处理器

一、如果我们在一段时间内用某个ip地址访问了一个网站次数过多,网站就检测到不正常,就会禁止这个ip地址的访问。所以我们可以设置一些代理服务器,每段时间换个代理,就算ip被禁止,我们也可以换个ip继续爬取

代理有

1、西刺免费代理:http://www.xicidaili.com/

2、快代理:http://www.kuaidaili.com/

3、代理云:http://www.dailiyun.com/

有免费的代理和付费的代理

二、通过网址:http://httpbin.org/ip,可以看到电脑与外网连接的ip,

也可以通过代码,url=\'http://httpbin.org/ip\',查看ip地址

 

url = \'http://httpbin.org/ip\'

resp=request.urlopen(url)
print(resp.read())

 

 

 三、当使用代理之后,ip地址就会发生变化

from urllib import request

url = \'http://httpbin.org/ip\'

# 1、使用 ProxyHandler,传入代理构建一个handler
handler = request.ProxyHandler({"http":"223.241.78.43:8010"})
# 2、使用上面创建的handler构建一个opener
opener = request.build_opener(handler)
# 3、使用opener去发送一个请求
resp=opener.open(url)
print(resp.read())

这个时候输出的结果就是代理的ip地址,网站不知道真实的ip地址,自己的ip地址就不会被禁了

以上是关于python爬虫 ProxyHandler处理器的主要内容,如果未能解决你的问题,请参考以下文章

9-python 的ProxyHandler处理器(代理设置)

Python3 爬虫U03_ProxyHandler实现代理

爬虫(ProxyHandler)——代理

python3下urllib.request库高级应用之ProxyHandler处理器(代理设置)

python爬虫使用代理

python中ProxyHandler处理器(代理)