python爬虫requests过程中添加headers

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫requests过程中添加headers相关的知识,希望对你有一定的参考价值。

浏览器中打开页面,以edge为例,点击“查看源”或F12

技术分享

第一步:点击上图中“网络”标签,然后刷新或载入页面

第二步:在右侧“标头”下方的“请求标头”中的所有信息都是headers内容,添加到requests请求中即可

代码示例如下:

headers = {Accept: text/html, application/xhtml+xml, image/jxr, */*,
               Accept - Encoding:gzip, deflate,
               Accept-Language:zh-Hans-CN, zh-Hans; q=0.5,
               Connection:Keep-Alive,
               Host:zhannei.baidu.com,
               User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36 Edge/15.15063}
r = requests.get(http://zhannei.baidu.com/cse/search, params=keyword, headers=headers, timeout=3)

 

以上是关于python爬虫requests过程中添加headers的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫中涉及json数据的处理

Python 爬虫神器 requests 工具

# yyds干货盘点 # Python网络爬虫过程中,构建网络请求的时候,参数`stream=True`的使用

python爬虫入门

python网络爬虫与信息提取——1.requests库入门

MOOC《Python网络爬虫与信息提取》学习过程笔记requests库第一周1-3