requests基础爬取流程

Posted huahuawang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了requests基础爬取流程相关的知识,希望对你有一定的参考价值。


# 需求:爬取搜狗首页的页面数据
import requests
if __name__ == ‘__main__‘:
# 1指定url
url = ‘https://www.sogou.com/‘
# 2发起请求
res = requests.get(url=url) # get方法会返回一个响应对象
# 3 获取响应数据.text返回的是字符串形式的响应数据
page_text = res.text
print(page_text)
# 4 持久化存储
fp = open(‘./sogou.html‘,‘w‘,encoding=‘utf-8‘)
fp.write(page_text)
print(‘爬取数据成功‘)

以上是关于requests基础爬取流程的主要内容,如果未能解决你的问题,请参考以下文章

爬虫基础

python爬取豆瓣首页热门栏目详细流程

小爬虫学习——使用 requests 爬取百度图片

Requests爬取网页内容

Requests爬取网页内容

Requests+正则爬取猫眼电影TOP100