url下载网页的三种方法

Posted brady-wang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了url下载网页的三种方法相关的知识,希望对你有一定的参考价值。

# -*- coding: utf-8 -*-
import cookielib
import urllib2

url = "http://www.baidu.com"
print "第一种方法"
response1 = urllib2.urlopen(url)
print response1.getcode()
print len(response1.read())

print "第二种方法"
res = urllib2.Request(url)
res.add_header("user-agent","Mozilla-5.0")
response2 = urllib2.urlopen(res)
print response2.getcode()
print len(response2.read())

print "第三种方法"
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor)
urllib2.install_opener(opener)
response3 = urllib2.urlopen(url)
print response3.getcode()
print cj
#print response3.read()

 

以上是关于url下载网页的三种方法的主要内容,如果未能解决你的问题,请参考以下文章

使用urllib2打开网页的三种方法

爬虫学习——网页下载器和urllib2模块

python抓取网页数据的三种方法

php获取POST数据的三种方法

将网页内容转化为PDF的三种方法

django--完成客户端下载文件的三种方式