urllib库详解

Posted ronghe

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了urllib库详解相关的知识,希望对你有一定的参考价值。

urllib库是python内置的一个http请求库

其实urllib库不好用,没有requests库好用,下一篇文章再写requests库,requests库是基于urllib库实现的

作为最最基本的请求库,了解一下原理还是很有必要的

常用模块:

urllib.request  请求模块

urllib.error    异常处理模块

urllib.parse      url解析模块

urllib.robotparser  robots.txt解析模块,判断哪个网站可以爬,哪个不可以爬,用的比较少

 

在python2与python3中有所不同

在python2中:

import urllib2

response = urllib2.urlopen(‘http://www.baidu.com‘)

在python3中:

import  urllib.request.urlopen(‘http://www.baidu.com‘)

用法讲解:

 

以上是关于urllib库详解的主要内容,如果未能解决你的问题,请参考以下文章

Python--urllib3库详解1

python urllib库详解

Python之urllib库详解

Python--urllib3库详解1

Requests库详解

urllib库解析