python爬虫requests过程中添加headers
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫requests过程中添加headers相关的知识,希望对你有一定的参考价值。
浏览器中打开页面,以edge为例,点击“查看源”或F12
第一步:点击上图中“网络”标签,然后刷新或载入页面
第二步:在右侧“标头”下方的“请求标头”中的所有信息都是headers内容,添加到requests请求中即可
代码示例如下:
headers = {‘Accept‘: ‘text/html, application/xhtml+xml, image/jxr, */*‘, ‘Accept - Encoding‘:‘gzip, deflate‘, ‘Accept-Language‘:‘zh-Hans-CN, zh-Hans; q=0.5‘, ‘Connection‘:‘Keep-Alive‘, ‘Host‘:‘zhannei.baidu.com‘, ‘User-Agent‘:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36 Edge/15.15063‘} r = requests.get(‘http://zhannei.baidu.com/cse/search‘, params=keyword, headers=headers, timeout=3)
以上是关于python爬虫requests过程中添加headers的主要内容,如果未能解决你的问题,请参考以下文章
# yyds干货盘点 # Python网络爬虫过程中,构建网络请求的时候,参数`stream=True`的使用