爬虫3-Requests库的主要方法

Posted rayshaw13

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫3-Requests库的主要方法相关的知识,希望对你有一定的参考价值。

Requests库的7个主要方法:

方法 说明
requests.request() 构造一个请求,支撑以下各方法的基础方法
requests.get() 获取html网页的主要方法,对应于HTTP的GET
requests.head() 获取HTML网页头信息的方法,对应HTTP的HEAD
requests.post() 向HTML网页提交POST请求的方法,对应于HTTP的POST
requests.put() 向HTTP网页提交PUT请求的方法,对应于HTTP的PUT
requests.patch() 向HTTP网页提交局部修改请求,对应于HTTP的PATCH
requests.delete() 向HTTP页面提交删除请求,对应于HTTP的DELETE

 

 

 

 

 

 

 

HTTP协议:超文本传输协议

URL是通过HTTP协议存取资源的Internet路径,一个url对应一个数据资源

HTTP对资源的操作有6个方法,与上表对应。

 

PATCH和PUT的区别:

HTTP协议方法与Requests库方法具有功能的一致性

head方法 用很少的流量获取网络的概要信息

 Requests库主要方法解析:

1、requests.request(method,url,**kwargs)

method:表示get head 等方法

url 表示路径

**kwargs  表示其他13个参数 控制访问的参数,均为可选项

比如params 对url进行修改的字段

data:字典、字节序列或文件,Request的内容

json:JSON格式的数据,作为Request的内容

kv={\'key1\':\'value1\'}
r=requests.request(\'POST\',\'http://python123.io/ws\',json=kv)

headers:字典,HTTP定制头

hd={\'user-agent\':\'Chrome/10\'}#表示将user-agent改为Chrome/10
r=requests.request(\'POST\',\'http://python123.io/ws\',headers=hd)

还有其他的一些字段,在这里不详述。

掌握get和head方法即可。

一定要用try except保证正常访问以及异常处理。

 

以上是关于爬虫3-Requests库的主要方法的主要内容,如果未能解决你的问题,请参考以下文章

python3爬虫

爬虫3 requests基础

全方面的掌握Requests库的使用【python爬虫入门进阶】(02)

网络爬虫-课程大纲

python爬虫入门

爬虫3 requests基础2 代理 证书 重定向 响应时间