Python爬虫编程思想(18):使用urllib3处理HTTP请求头和HTTP响应头

Posted 蒙娜丽宁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(18):使用urllib3处理HTTP请求头和HTTP响应头相关的知识,希望对你有一定的参考价值。

目录

1. HTTP请求头        

2. HTTP响应头


1. HTTP请求头        

        大多数服务端应用都会检测某些HTTP请求头,例如,为了阻止网络爬虫或其他的目的,通常会检测HTTP请求头的User-Agent字段,该字段指定了用户代理,也就是用什么应用访问的服务端程序,如果是浏览器,如Chrome,会包含Mozilla/5.0或其他类似的内容,如果HTTP请求头不包含这个字段,或该字段的值不符合要求,那么服务端程序就会拒绝访问。还有一些服务端应用要求只有处于登录状态才可以访问某些数据,所以需要检测HTTP请求头的cookie字段,该字段会包含标识用户登录的信息。当然,服务端应用也可能会检测HTTP请求头的其他字段,

以上是关于Python爬虫编程思想(18):使用urllib3处理HTTP请求头和HTTP响应头的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(17):使用urllib3发送HTTP Get和HTTP POST请求

Python爬虫编程思想(19):使用urllib3上传文件与处理超时

Python爬虫编程思想:用urllib处理请求超时

Python爬虫编程思想(10):通过urllib设置HTTP请求头

Python爬虫编程思想(36):项目实战-抓取斗破小说网的目录和全文

Python爬虫编程思想(11):用urllib请求基础验证页面