Python爬虫编程思想（18）：使用urllib3处理HTTP请求头和HTTP响应头

Posted 2021-09-18 蒙娜丽宁

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python爬虫编程思想（18）：使用urllib3处理HTTP请求头和HTTP响应头相关的知识，希望对你有一定的参考价值。

1. HTTP请求头

大多数服务端应用都会检测某些HTTP请求头，例如，为了阻止网络爬虫或其他的目的，通常会检测HTTP请求头的User-Agent字段，该字段指定了用户代理，也就是用什么应用访问的服务端程序，如果是浏览器，如Chrome，会包含Mozilla/5.0或其他类似的内容，如果HTTP请求头不包含这个字段，或该字段的值不符合要求，那么服务端程序就会拒绝访问。还有一些服务端应用要求只有处于登录状态才可以访问某些数据，所以需要检测HTTP请求头的cookie字段，该字段会包含标识用户登录的信息。当然，服务端应用也可能会检测HTTP请求头的其他字段，

以上是关于Python爬虫编程思想（18）：使用urllib3处理HTTP请求头和HTTP响应头的主要内容，如果未能解决你的问题，请参考以下文章