初入网络系列笔记HTTP请求和响应

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了初入网络系列笔记HTTP请求和响应相关的知识,希望对你有一定的参考价值。

一、借鉴说明,本博文借鉴以下博文

  1.starok,HTTP必知必会,http://www.cnblogs.com/starstone/p/4890409.html

  2.CareySon,HTTP协议漫谈,http://www.cnblogs.com/CareySon/archive/2012/04/27/HTTP-Protocol.html

  3.逖靖寒,浅析HTTP协议,http://www.cnblogs.com/gpcuster/archive/2009/05/25/1488749.html

  4.Chance_yin,HTTP深入浅出http请求,http://www.cnblogs.com/yin-jingyu/archive/2011/08/01/2123548.html

二、HTTP请求

  • 请求消息的格式

  HTTP请求消息也分为三个部分:

  1.请求行

  2.请求头部

  3.请求正文

  其中请求头部的格式我们已经见过。请求行的基本格式为:

  方法 路径 版本

  例如下面的例子:

  GET /simple.html HTTP/1.1

  就有对应关系:

  • 方法:GET
  • 路径:/simple.html
  • 版本:HTTP/1.1

  请求行是HTTP请求消息的最基本要素。版本是用来声明HTTP消息的解析规则,不同的版本在某些地方的表现是不同的,这里不作过多拆解了。现在实际应用中最新的HTTP协议版本就是HTTP/1.1。路径可以理解成该请求消息发往服务器的入口,一般来讲,同一个路径应该代表同一个资源实体。方法表示对该资源实体进行的操作,例如上述的GET方法,其含义就是请求获取该资源的内容。这些都是通常的解释,但不是必然的要求。实际上,服务器会解析到方法和路径,根据方法和路径做出自己相应的响应。这种响应的规则,可以遵循某些规范,也可以完全不考虑这些规范,是任意的。市面上已经存在一些约定俗成的规范了,比如Restful。Restful是非常优秀的基于HTTP协议的WEB API设计理念,很值得讲,但在这里就不讲了。

  • 方法

  首先列出最常用的HTTP方法:

  1.GET

  2.POST

  3.PUT

  4.PATCH

  5.DELETE

  6.HEAD

  7.OPTIONS

  之前说过,服务器对于方法的处理,是没有强制的规范的。这句话说得并不全对。其实每个HTTP方法,都是有一些HTTP协议要求的。比如说GET方法请求的资源,浏览器端一般都会有缓存,下次请求的时候可能从缓存中去取就够了,服务器不用再重复发送相同的资源了;但是服务器如果将获取资源的接口的方法定义为POST,那么浏览器端就不会再对资源进行缓存了,即使每次取到的都是同样地内容,都会请求服务器重新发送一遍。所以说,将请求资源的接口的方法定义为POST而不是GET,就是一种不合理的设计。

  再比如,GET方法的请求消息是不能定义消息体的,HEAD方法的请求其响应消息是不包含消息体的,这些都是HTTP协议对于HTTP方法的约束。

  • 路径

  方法和路径的组合构成WEB API的入口,路径也是很关键的。路径的基本格式一般是:

  basic-path[?query-string]

  其中[]中的内容表示可选的。在上例中,basic-path就是/simple.html,但不包含query-string的内容。basic-path形式很像UNIX中绝对路径的样式,要以/打头。单独的/表示一种路径,/a、/a/b、/a/b/c都是合理的路径表示。不推荐使用/a/、/a/b/、/a/b/c/这样/后面不跟任何其他内容的形式(/除外)。优秀的API设计者会利用不同的路径层级来合理地组织资源。

  问号后面的部分就是query-string。它的格式是任意的,只要客户端和服务器约定好一定的形式即可。这个部分一般是请求参数的附加。之前说过,GET方法是不包含请求体的,所以GET方法的HTTP请求想要附加参数只能使用这种方式。当然其他方法也是可以使用这种方式附加参数,只要服务器同意就可以了。query-string的格式任意,但在客户端和服务器之间也有预先定好的约定,即键值对的形式。query-string可以表示成一系列键值对的集合,用以下方式表示:

  k1=v1&k2=v2&k3=&k4
										

  在这里,&分隔不同的键值对,=表示键和值得关系。可以看到一共有四个键值对关系,它们是:

  • k1: v1
  • k2: v2
  • k3: 空字符串
  • k4: 起码该键被定义了

  一般来说,键值对要写成k=v的形式,但是k=和仅仅一个k都是允许的,前者表示键k的值是空字符串,后者表示键k被定义了,但是其值是什么并不关心。

  从上面的例子中发现,在query-string中&和=被用于特殊的用途了,我们不能再在其中从容地使用这两个符号了。如果我们要在值中包含这两个符号,那咋办呢?方法就是,编码

  在实际的HTTP请求中,对于如下的键值关系

  k1: &

  k2: =

  具体的query-string要写成:

  k1=%26&k2=%3D

  这是因为在ASCII编码中,&的16进制表示是26,=的16进制表示是3D。对于需要的编码,就要表示成其实际编码的16进制表示,每个字节都用一个%XX三个字符进行表示。这样,%本身也就要进行编码了,它的编码是%25。除了这些控制字符的编码,还可以进行中文等非英语语言的编码。

  对于编码部分,我推荐阮一峰的一篇博文

  关于URL编码

  虽然看了也未必懂了,但是最起码知道编码不是一件简单的事情。

  • 请求头

  HTTP请求头格式与之前所说的消息头格式没什么两样,就是以冒号分隔的键值对。HTTP请求头中,既包含预定义的头(如Content-Type、Content-Length等),也支持自定义头。原本打算多列出几个常见的请求头的,但限于精力,不打算这样做了。我只说说我最常用的Content-Type头吧。

  Content-Type头,既可用于请求消息,也可用于响应消息,是规定请求正文内容格式的头部。例如利用这个头部,我们可以规定正文的格式为纯文本格式、表单格式、XML格式、JSON格式、图像格式等。例如Content-Type: application/json就表示JSON文本格式。

  在小节的末尾,我良心地给出一个关于HTTP预定义头的参考网址:

  HTTP消息头大全

三、HTTP响应

  HTTP响应消息的基本格式也是一样的,包含三个部分:

  1.响应行

  2.响应头部

  3.响应正文

  响应头部和响应正文我觉得不需要再多说了。响应行的基本格式是:

  版本号 状态码 状态文本

  例如下面的响应行:

  HTTP/1.1 200 OK

  其对应关系为:

  • 版本号:HTTP/1.1
  • 状态码:200
  • 状态文本:OK

  HTTP状态码主要表示应答的状态。状态码是由3个数字表示,其中第一个数字表示一个大状态,后面两个数字表示该大状态的一个子状态。200就表示操作成功,还有其他常见的如404表示对象未找到,500表示服务器错误,403表示不能浏览目录等等。

  状态码一共分为五个大状态,它们是:

  • 1xx
  • 2xx:请求成功处理
  • 3xx
  • 4xx:客户端出错
  • 5xx:服务器出错

  HTTP状态码大全

以上是关于初入网络系列笔记HTTP请求和响应的主要内容,如果未能解决你的问题,请参考以下文章

初入网络系列笔记HTTP协议最简单的掌握

网络协议系列之一:HTTP

网络协议系列之一:HTTP

爬虫系列 | 2Http请求和响应,写爬虫这些内容必须掌握

简洁!get请求和post请求的区别——Web网络系列学习笔记

简洁!get请求和post请求的区别——Web网络系列学习笔记