python 给定URL 如何获取其内容,并将其保存至HTML文档。

Posted blogzyq

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 给定URL 如何获取其内容,并将其保存至HTML文档。相关的知识,希望对你有一定的参考价值。

获取URL的内容需要用到标准库urllib包,其中的request模块。

import urllib.request
url=‘http://www.baidu.com‘
response=urllib.request.urlopen(url)
string=response.read()
html=string.decode(‘utf-8‘)
print(html)

urlopen()方法返回一个<class ‘http.client.HTTPResponse‘>

即标准库http包里的对象,该包是一个底层包,由request模块调用。

read()方法返回一个<class ‘bytes‘>

字节对象转成str对象用str.decode()方法

将获取的str对象内容保存到HTML文件,需用到程序内置的方法open()

f=open(‘lc.html‘,‘w‘)
f.write(html)
f.close()

  open()方法返回一个<class ‘_io.TextIOWrapper‘>

  write()方法是向文件对象写入str内容

  最后要关闭文件对象

 

以上是关于python 给定URL 如何获取其内容,并将其保存至HTML文档。的主要内容,如果未能解决你的问题,请参考以下文章