pytho爬虫之requests的使用

Posted lweiser

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pytho爬虫之requests的使用相关的知识,希望对你有一定的参考价值。

一、requests库的安装

(1)、pip3 install requests

(2)、在pycharm中进行安装

          技术图片

 

二、基于HTTP协议的requests的请求机制

 1、http协议:(以请求百度为例)
  (1)请求url:
      https://www.baidu.com/

  (2)请求方式:
    GET

  (3)请求头:
    Cookie: 可能需要关注。
    User-Agent: 用来证明你是浏览器
    注意: 去浏览器的request headers中查找
    Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/65.0.3325.146 Safari/537.36
    Host: www.baidu.com
  

 2、浏览器的使用

 

          技术图片

  3、爬取百度主页 

 1 import requests
 2 
 3 response = requests.get(url=https://www.baidu.com/)
 4 response.encoding = utf-8
 5 print(response)  # <Response [200]>
 6 # 返回响应状态码
 7 print(response.status_code)  # 200
 8 # 返回响应文本
 9 # print(response.text)
10 print(type(response.text))  # <class ‘str‘>
11 #将爬取的内容写入xxx.html文件
12 with open(baidu.html, w, encoding=utf-8) as f:
13     f.write(response.text)
 

 

三、爬取“梨视频”中的视频

1 # 爬取梨视频
2 import requests
3 url=https://video.pearvideo.com/mp4/adshort/20190613/cont-1565846-14013215_adpkg-ad_hd.mp4
4 res = requests.get(url)
5 #将爬取的视频写入文件
6 with open(梨视频.mp4, wb) as f:
7     f.write(res.content)

 

  

 

以上是关于pytho爬虫之requests的使用的主要内容,如果未能解决你的问题,请参考以下文章

爬虫学习推荐目录

爬虫之requests介绍

爬虫之request模块

爬虫学习 04.Python网络爬虫之requests模块

python爬虫之requests的基本使用

Python爬虫之request模块