urllib库基本使用
Posted xsan
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了urllib库基本使用相关的知识,希望对你有一定的参考价值。
#导入urllib库 import urllib.request #打开网址 file=urllib.request.urlopen("http://www.sohu.com/",timeout=5) #读取网页源码 file.read().decode("utf-8","ignor") #返回爬取网页的状态码 print(file.getcode()) #获取当前访问网页的url print(file.geturl()) #清除网页缓存 urllib.request.urlcleanup() #直接下载网页到本地,在下载图片、音频等时候使用 # urllib.request.urlretrieve("网址","本地文件存储路径+文件名") urllib.request.urlretrieve("http://audio.xmcdn.com/group6/M05/A8/FF/wKgDg1dsApazZL0ZAKval9KT2Hc966.m4a","I:/?555555555555") #网址拼接时,需转码 ‘‘‘ 如果在构造网址时需要将中文拼接进去时,最好转下码再拼接 ‘‘‘ keywd="汪峰" keywd=urllib.request.quote(keywd) url="http://www.baidu.com/s?wd="+keywd
以上是关于urllib库基本使用的主要内容,如果未能解决你的问题,请参考以下文章
Urllib库基本使用详解(爬虫,urlopen,request,代理ip的使用,cookie解析,异常处理,URL深入解析)
Python 爬虫之urllib库,及urllib库的4个模块基本使用和了解