Python爬虫编程思想:使用urllib库发送HTTP请求和接收响应

Posted 蒙娜丽宁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想:使用urllib库发送HTTP请求和接收响应相关的知识,希望对你有一定的参考价值。

目录

1. urllib简介

2.  用urlopen函数发送HTTP GET请求

3. 用urlopen函数发送HTTP POST请求

        编写爬虫的第一步就是选择一个好用的网络库,通过网络库的API可以发送请求,并接收服务端的响应。Python语言中的网络库有很多,有内置的,有第三方的。首先我们会讲一个Python内置的网络库:urllib。关于urllib,我们会讲如下内容。

  • urllib的主要功能
  • 发送HTTP请求和接收响应
  • 请求超时
  • 设置HTTP请求头
  • 请求验证页面
  • 使用代理
  • 读取和设置Cookie
  • 异常处理<

以上是关于Python爬虫编程思想:使用urllib库发送HTTP请求和接收响应的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(17):使用urllib3发送HTTP Get和HTTP POST请求

Python爬虫编程思想:用urllib处理请求超时

Python爬虫编程思想(36):项目实战-抓取斗破小说网的目录和全文

Python爬虫编程思想(16):Robots协议(不了解这个就是面向监狱编程了)

Python爬虫编程思想(18):使用urllib3处理HTTP请求头和HTTP响应头

Python爬虫编程思想(25):使用requests实现身份验证和请求打包