爬虫(ProxyHandler)——代理

Posted 高圈圈

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫(ProxyHandler)——代理相关的知识,希望对你有一定的参考价值。

工具:python3

步骤:

1)使用ProxyHandler()构建httpproxy_handler对象 

2)使用build_opener(httpproxy_handler)构建opener

3)使用Request()构造请求

4)使用instal_opener()构造一个全局opener

5)发送请求

import urllib.request

# 代理开关,表示是否启用代理
proxyswitch = True

# 构建一个Handler处理器对象,参数是一个字典,包括代理类型和代理服务器IP,port
httpproxy_handler = urllib.request.ProxyHandler({"http": "175.42.122.115:808"})

# 构建一个没有代理的处理器对象,也要有一个空字典返回
nullproxy_handler = urllib.request.ProxyHandler({})

if proxyswitch:
    opener = urllib.request.build_opener(httpproxy_handler)
else:
    opener = urllib.request.build_opener(nullproxy_handler)

request = urllib.request.Request("http://www.baidu.com/")

# 构建一个全局opener,之后所有的请求都可以用urlopen()方式发出去,也附带handler功能 urllib.request.install_opener(opener) request
= urllib.request.urlopen(request) print(request.read())

 

以上是关于爬虫(ProxyHandler)——代理的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫 ProxyHandler处理器

Python3 爬虫U03_ProxyHandler实现代理

9-python 的ProxyHandler处理器(代理设置)

python爬虫使用代理

python3下urllib.request库高级应用之ProxyHandler处理器(代理设置)

python中ProxyHandler处理器(代理)