简单爬取网页源码

Posted xlsxls

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了简单爬取网页源码相关的知识,希望对你有一定的参考价值。

import urllib.request

url = http://www.baidu.com/
response = urllib.request.urlopen(url)
data = response.read()
str_data = data.decode(utf_8)
# print(str_data)
with open(baidu.html,w,encoding=utf_8) as  f:
    f.write(str_data)

 

以上是关于简单爬取网页源码的主要内容,如果未能解决你的问题,请参考以下文章

网页源码爬取

python 爬虫 requests+BeautifulSoup 爬取简单网页代码示例

scrapy中使用selenium+webdriver获取网页源码,爬取简书网站

scrapy中使用selenium+webdriver获取网页源码,爬取简书网站

python如何获取网页源码中整个<body>的内容?

不用写代码,如何爬取简单网页的信息?