简单爬取网页源码
Posted xlsxls
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了简单爬取网页源码相关的知识,希望对你有一定的参考价值。
import urllib.request url = ‘http://www.baidu.com/‘ response = urllib.request.urlopen(url) data = response.read() str_data = data.decode(‘utf_8‘) # print(str_data) with open(‘baidu.html‘,‘w‘,encoding=‘utf_8‘) as f: f.write(str_data)
以上是关于简单爬取网页源码的主要内容,如果未能解决你的问题,请参考以下文章
python 爬虫 requests+BeautifulSoup 爬取简单网页代码示例
scrapy中使用selenium+webdriver获取网页源码,爬取简书网站