pytho爬虫之requests的使用

Posted 2022-01-16 lweiser

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了pytho爬虫之requests的使用相关的知识，希望对你有一定的参考价值。

一、requests库的安装

（1）、pip3 install requests

（2）、在pycharm中进行安装

技术图片

二、基于HTTP协议的requests的请求机制

　1、http协议:（以请求百度为例）
　　（1）请求url:
　　　　　　https://www.baidu.com/

　　（2）请求方式:
　　　　GET

　　（3）请求头:
　　　　Cookie：可能需要关注。
　　　　User-Agent: 用来证明你是浏览器
　　　　注意: 去浏览器的request headers中查找
　　　　Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/65.0.3325.146 Safari/537.36
　　　　Host: www.baidu.com　　

　2、浏览器的使用

技术图片

　　3、爬取百度主页　

 1 import requests
 2 
 3 response = requests.get(url=‘https://www.baidu.com/‘)
 4 response.encoding = ‘utf-8‘
 5 print(response)  # <Response [200]>
 6 # 返回响应状态码
 7 print(response.status_code)  # 200
 8 # 返回响应文本
 9 # print(response.text)
10 print(type(response.text))  # <class ‘str‘>
11 #将爬取的内容写入xxx.html文件
12 with open(‘baidu.html‘, ‘w‘, encoding=‘utf-8‘) as f:
13     f.write(response.text)

三、爬取“梨视频”中的视频

1 # 爬取梨视频
2 import requests
3 url=‘https://video.pearvideo.com/mp4/adshort/20190613/cont-1565846-14013215_adpkg-ad_hd.mp4‘
4 res = requests.get(url)
5 #将爬取的视频写入文件
6 with open(‘梨视频.mp4‘, ‘wb‘) as f:
7     f.write(res.content)

以上是关于pytho爬虫之requests的使用的主要内容，如果未能解决你的问题，请参考以下文章