爬虫4 proxy 使用代理服务器发送请求

Posted 黑无常

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫4 proxy 使用代理服务器发送请求相关的知识,希望对你有一定的参考价值。

简述:使用代理服务器发送请求,隐藏自己的真是ip...

  request = Request(url, headers=headers)

  1. 使用urllib.request下的ProxyHandler模块,来加载代理ip,生成对象

  2. 使用urllib.request下的build_opener模块,加载代理对象

"""proxy, 使用代理地址,防止本机ip被爬取的网站查封
    1. 使用代理ip信息, 查询‘ip代理’, 此处使用‘快代理’中的代理地址
    1. ProxyHandler库, 加载代理ip地址
    2. build_opener库, 类似urlopen,是用来做代理地址请求的
"""

from urllib.request import Request, build_opener
from fake_useragent import UserAgent
from urllib.request import ProxyHandler


url = "http://httpbin.org/get"      # 此网址可以发返回发送的请求头信息
headers = {
    User-Agent: UserAgent().chrome
}
request = Request(url, headers=headers)

# 创建代理地址对象
handler = ProxyHandler({http: 182.46.197.33:9999})

# 创建代理请求对象, 加载代理地址对象
opener = build_opener(handler)

# 发送请求, 返回响应
response = opener.open(request)
info = response.read()
print(info.decode())

 

以上是关于爬虫4 proxy 使用代理服务器发送请求的主要内容,如果未能解决你的问题,请参考以下文章

你还不会Python网络爬虫中的requests模块使用?《二》

nodejs通过代理(proxy)发送http请求(request)

nodejs通过代理(proxy)发送http请求(request)

python 爬虫proxy,BeautifulSoup+requests+mysql 爬取样例

Python爬虫-Proxy代理的使用

爬虫设置代理