Python爬虫编程思想:使用urllib库发送HTTP请求和接收响应
Posted 蒙娜丽宁
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想:使用urllib库发送HTTP请求和接收响应相关的知识,希望对你有一定的参考价值。
目录
编写爬虫的第一步就是选择一个好用的网络库,通过网络库的API可以发送请求,并接收服务端的响应。Python语言中的网络库有很多,有内置的,有第三方的。首先我们会讲一个Python内置的网络库:urllib。关于urllib,我们会讲如下内容。
- urllib的主要功能
- 发送HTTP请求和接收响应
- 请求超时
- 设置HTTP请求头
- 请求验证页面
- 使用代理
- 读取和设置Cookie
- 异常处理<
以上是关于Python爬虫编程思想:使用urllib库发送HTTP请求和接收响应的主要内容,如果未能解决你的问题,请参考以下文章
Python爬虫编程思想(17):使用urllib3发送HTTP Get和HTTP POST请求
Python爬虫编程思想(36):项目实战-抓取斗破小说网的目录和全文
Python爬虫编程思想(16):Robots协议(不了解这个就是面向监狱编程了)