python爬虫requests过程中添加headers

Posted 2020-09-30

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python爬虫requests过程中添加headers相关的知识，希望对你有一定的参考价值。

浏览器中打开页面，以edge为例，点击“查看源”或F12

技术分享

第一步：点击上图中“网络”标签，然后刷新或载入页面

第二步：在右侧“标头”下方的“请求标头”中的所有信息都是headers内容，添加到requests请求中即可

代码示例如下：

headers = {‘Accept‘: ‘text/html, application/xhtml+xml, image/jxr, */*‘,
               ‘Accept - Encoding‘:‘gzip, deflate‘,
               ‘Accept-Language‘:‘zh-Hans-CN, zh-Hans; q=0.5‘,
               ‘Connection‘:‘Keep-Alive‘,
               ‘Host‘:‘zhannei.baidu.com‘,
               ‘User-Agent‘:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36 Edge/15.15063‘}
r = requests.get(‘http://zhannei.baidu.com/cse/search‘, params=keyword, headers=headers, timeout=3)

以上是关于python爬虫requests过程中添加headers的主要内容，如果未能解决你的问题，请参考以下文章