urllib 库的基础和实用

Posted 纯情

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了urllib 库的基础和实用相关的知识,希望对你有一定的参考价值。

对于urllib中我们先需要导入你想实用的类

 import urllib

 一般需要爬取信息等

import urllib.request

或 from urllib import request ,当程序导入完

我们先说说 urllib 下一些常用的方法吧

比如说:

        urllib.request.urlopen("网页路径")

        urllib.request.uropen("网页路径",timeout="设置爬取时间")

//这一般是读取你需要的网页页面信息

       urllib.request.urlretrieve("网页地址",filename="本地磁盘地址")

 //把你需要的网页信息爬在本地磁盘

       urllib.request.urlcleanup()

//清除爬取缓存 是什么意思呢?就比如说你要爬取网页到自己磁盘本地时,缓存中就存在的操作进行清除

n.info()

//查看你网页的环境信息

getcode()  //返回当前网页的状态

geturl()//查看网页地址

 

以上是关于urllib 库的基础和实用的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫基础urllib2库的get与post方法

爬虫基础(requests库的基本使用)--02

urllib库的应用及简单爬虫的编写

Python 爬虫之urllib库,及urllib库的4个模块基本使用和了解

Python 爬虫之urllib库,及urllib库的4个模块基本使用和了解

Urllib库的使用