模拟浏览器——Headers属性

Posted yyyyuan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了模拟浏览器——Headers属性相关的知识,希望对你有一定的参考价值。

方法一、使用build_opener()修改报头

1 import urllib.request
2 url = "https://www.cnblogs.com"
3 headers = (
4     "User-Agent",
5     "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/64.0.3282.186 Safari/537.36"
6            )
7 opener = urllib.request.build_opener()
8 opener.addheaders = [headers]
9 data = opener.open(url).read()

方法二、使用add_header()添加报头

import urllib.request
url = "http://blog.csdn.net/column.html"
req = urllib.request.Request(url)
req.add_header(
"User-Agent", "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36"
) data = urllib.request.urlopen(req).read()

 

以上是关于模拟浏览器——Headers属性的主要内容,如果未能解决你的问题,请参考以下文章

如何在C#中模拟基类属性或方法

Python爬虫实例网站模拟登陆

urllib库的高级用法

urllib2高级特性使用

在python获取网页的代码中添加头信息模拟浏览器

在python获取网页的代码中添加头信息模拟浏览器