urllib库详解
Posted ronghe
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了urllib库详解相关的知识,希望对你有一定的参考价值。
urllib库是python内置的一个http请求库
其实urllib库不好用,没有requests库好用,下一篇文章再写requests库,requests库是基于urllib库实现的
作为最最基本的请求库,了解一下原理还是很有必要的
常用模块:
urllib.request 请求模块
urllib.error 异常处理模块
urllib.parse url解析模块
urllib.robotparser robots.txt解析模块,判断哪个网站可以爬,哪个不可以爬,用的比较少
在python2与python3中有所不同
在python2中:
import urllib2
response = urllib2.urlopen(‘http://www.baidu.com‘)
在python3中:
import urllib.request.urlopen(‘http://www.baidu.com‘)
用法讲解:
以上是关于urllib库详解的主要内容,如果未能解决你的问题,请参考以下文章