爬虫3-Requests库的主要方法

Posted 2020-10-28 rayshaw13

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了爬虫3-Requests库的主要方法相关的知识，希望对你有一定的参考价值。

Requests库的7个主要方法：

方法	说明
requests.request()	构造一个请求，支撑以下各方法的基础方法
requests.get()	获取html网页的主要方法，对应于HTTP的GET
requests.head()	获取HTML网页头信息的方法，对应HTTP的HEAD
requests.post()	向HTML网页提交POST请求的方法，对应于HTTP的POST
requests.put()	向HTTP网页提交PUT请求的方法，对应于HTTP的PUT
requests.patch()	向HTTP网页提交局部修改请求，对应于HTTP的PATCH
requests.delete()	向HTTP页面提交删除请求，对应于HTTP的DELETE

HTTP协议：超文本传输协议

URL是通过HTTP协议存取资源的Internet路径，一个url对应一个数据资源

HTTP对资源的操作有6个方法，与上表对应。

PATCH和PUT的区别：

HTTP协议方法与Requests库方法具有功能的一致性

head方法用很少的流量获取网络的概要信息

Requests库主要方法解析：

1、requests.request(method,url,**kwargs)

method:表示get head 等方法

url 表示路径

**kwargs 表示其他13个参数控制访问的参数，均为可选项

比如params 对url进行修改的字段

data：字典、字节序列或文件，Request的内容

json：JSON格式的数据，作为Request的内容

kv={\'key1\':\'value1\'}
r=requests.request(\'POST\',\'http://python123.io/ws\',json=kv)

headers：字典，HTTP定制头

hd={\'user-agent\':\'Chrome/10\'}#表示将user-agent改为Chrome/10
r=requests.request(\'POST\',\'http://python123.io/ws\',headers=hd)

还有其他的一些字段，在这里不详述。

掌握get和head方法即可。

一定要用try except保证正常访问以及异常处理。

以上是关于爬虫3-Requests库的主要方法的主要内容，如果未能解决你的问题，请参考以下文章