web系列-HTTP协议

Posted 朱朱有话和你说

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了web系列-HTTP协议相关的知识,希望对你有一定的参考价值。

HTTP协议

超文本传输协议(英文:HyperText Transfer Protocol,缩写:HTTP)是一种用于分布式、协作式和超媒体信息系统的应用层协议。HTTP是万维网的数据通信的基础。

HTTP协议是请求响应的模式。HTTP协议中规定,请求从客户端发出,最后服务器端响应该请求并 返回。换句话说,肯定是先从客户端开始建立通信的,服务器端在没有 接收到请求之前不会发送响应。

HTTP的大概流程如下:

通信流程

HTTP通信机制是在一次完整的HTTP通信过程中,Web浏览器与Web服务器之间将完成下列7个步骤:

  • 建立TCP连接

    • 在HTTP工作开始之前,Web浏览器首先要通过网络与Web服务器建立连接,该连接是通过TCP来完成的,该协议与IP协议共同构建 Internet,即著名的TCP/IP协议族,因此Internet又被称作是TCP/IP网络。HTTP是比TCP更高层次的应用层协议,根据规则, 只有低层协议建立之后才能,才能进行更层协议的连接,因此,首先要建立TCP连接,一般TCP连接的端口号是80。

  • Web浏览器向Web服务器发送请求行

    • 一旦建立了TCP连接,Web浏览器就会向Web服务器发送请求命令。例如:GET /sample/hello.jsp HTTP/1.1。

  • Web浏览器发送请求头

    • 浏览器发送其请求命令之后,还要以头信息的形式向Web服务器发送一些别的信息,之后浏览器发送了一空白行来通知服务器,它已经结束了该头信息的发送。

  • Web服务器应答

    • 客户机向服务器发出请求后,服务器会客户机回送应答, HTTP/1.1 200 OK ,应答的第一部分是协议的版本号和应答状态码。

  • Web服务器发送应答头

    • 正如客户端会随同请求发送关于自身的信息一样,服务器也会随同应答向用户发送关于它自己的数据及被请求的文档。

  • Web服务器向浏览器发送数据

    • Web服务器向浏览器发送头信息后,它会发送一个空白行来表示头信息的发送到此为结束,接着,它就以Content-Type应答头信息所描述的格式发送用户所请求的实际数据。

  • Web服务器关闭TCP连接

    • 一般情况下,一旦Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,然后如果浏览器或者服务器在其头信息加入了这行代码:

Connection:keep-alive

TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。

请求相关

请求报文

web系列-HTTP协议

web系列-HTTP协议

简单来说请求报文的组成部分有:

  • 请求行:请求方法、请求URL、协议版本

  • 请求头:键值对的形式存在的,就是字段名:值

  • 内容实体:传输的数据

注意,每一行的末尾都有回车和换行,在内容实体和请求头之间另有一个空行。

简单示例:

web系列-HTTP协议

请求方法

  • GET

    • 用来请求访问已被URI识别的资源。也就是指定了服务器处理请求之后响应的内容。

  • HEAD

    • 与GET方法一样,都是向服务器发出指定资源的请求。只不过服务器将不传回资源的本文部分。它的好处在于,使用这个方法可以在不必传输全部内容的情况下,就可以获取其中“关于该资源的信息”(元信息或称元数据)。

  • POST

    • 向指定资源提交数据,请求服务器进行处理(例如提交表单或者上传文件)。数据被包含在请求本文中。这个请求可能会创建新的资源或修改现有资源,或二者皆有。

  • PUT

    • PUT方法用来传输文件,向指定资源位置上传其最新内容。类似FTP协议,文件内容包含在请求报文的实体中,然后请求保存到URL指定的服务器位置。

  • DELETE

    • 请求服务器删除Request-URI所标识的资源。,是与PUT相反的方法。DELETE是要求返回URL指定的资源。

  • OPTIONS:

    • 因为并不是所有的服务器都支持规定的方法,为了安全有些服务器可能会禁止掉一些方法例如DELETE、PUT等。那么OPTIONS就是用来询问服务器支持的方法。

  • TRACE:

    • 回显服务器收到的请求,主要用于测试或诊断。

  • CONNECT:

    • CONNECT方法要求在与代理服务器通信时建立隧道,实现用隧道协议进行TCP通信。主要使用SSL/TLS协议对通信内容加密后传输。

响应相关

响应报文

web系列-HTTP协议

web系列-HTTP协议

简单来说响应报文组成部分有:

  • 状态行:HTTP版本,状态码和状态短语

  • 响应首部字段(响应头):是键值对的形式,字段名:值

  • 响应实体组成:要传输的数据

注意,每一行的末尾都有回车和换行,在响应实体和响应头之间另有一个空行。

响应示例:

响应码

列举了一些比较常见的,面试频率比较高的响应码:

  • 1(信息类):表示接收到请求并且继续处理

    • 100——客户必须继续发出请求

    • 101——客户要求服务器根据请求转换HTTP协议版本

  • 2(响应成功):表示动作被成功接收、理解和接受

    • 200——表明该请求被成功地完成,所请求的资源发送回客户端

    • 201——提示知道新文件的URL

    • 202——接受和处理、但处理未完成

    • 203——返回信息不确定或不完整

    • 204——请求收到,但返回信息为空

    • 205——服务器完成了请求,用户代理必须复位当前已经浏览过的文件

    • 206——服务器已经完成了部分用户的GET请求

  • 3(重定向类):为了完成指定的动作,必须接受进一步处理

    • 300——请求的资源可在多处得到

    • 301——本网页被永久性转移到另一个URL

    • 303——建议客户访问其他URL或访问方式

    • 304——自从上次请求后,请求的网页未修改过,服务器返回此响应时,不会返回网页内容,代表上次的文档已经被缓存了,还可以继续使用

    • 306——前一版本HTTP中使用的代码,现行版本中不再使用

    • 307——申明请求的资源临时性删除

  • 4(客户端错误类):请求包含错误语法或不能正确执行

    • 400——客户端请求有语法错误,不能被服务器所理解

    • 401——请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用

    • 402——保留有效ChargeTo头响应

    • 403——禁止访问,服务器收到请求,但是拒绝提供服务

    • 404——一个404错误表明可连接服务器,但服务器无法取得所请求的网页,请求资源不存在。eg:输入了错误的URL

    • 405——用户在Request-Line字段定义的方法不允许

    • 406——根据用户发送的Accept,请求资源不可访问

    • 407——类似401,用户必须首先在代理服务器上得到授权

    • 408——客户端没有在用户指定的时间内完成请求

    • 409——对当前资源状态,请求不能完成

    • 411——服务器拒绝用户定义的Content-Length属性请求

    • 412——一个或多个请求头字段在当前请求中错误

    • 413——请求的资源大于服务器允许的大小

    • 414——请求的资源URL长于服务器允许的长度

    • 415——请求资源不支持请求项目格式

    • 416——请求中包含Range请求头字段,在当前请求资源范围内没有range指示值,请求也不包含If-Range请求头字段

    • 417——服务器不满足请求Expect头字段指定的期望值,如果是代理服务器,可能是下一级服务器不能满足请求长。

  • 5(服务端错误类):服务器不能正确执行一个正确的请求

    • 500 - 服务器遇到错误,无法完成请求

    • 501 - 未实现

    • 502 - 网关错误

    • 503:由于超载或停机维护,服务器目前无法使用,一段时间后可能恢复正常

浏览器输入网址到看到网页的过程

  • 浏览器发出读取文件(URL 中域名后面部分对应的文件)的HTTP 请求,该请求报文作为 TCP三次握手中的第三个报文的数据发送给服务器;

  • 服务器对浏览器请求作出响应,并把对应的 html 文本发送给浏览器;

  • 释放 TCP连接

  • 浏览器将该 html 文本并显示内容;  

HTTPS

HTTPS工作原理

  • 首先HTTP请求服务端生成证书,客户端对证书的有效期、合法性、域名是否与请求的域名一致、证书的公钥(RSA加密)等进行校验;

  • 客户端如果校验通过后,就根据证书的公钥的有效, 生成随机数,随机数使用公钥进行加密(RSA加密);

  • 消息体产生的后,对它的摘要进行MD5(或者SHA1)算法加密,此时就得到了RSA签名;

  • 发送给服务端,此时只有服务端(RSA私钥)能解密。

  • 解密得到的随机数,再用AES加密,作为密钥(此时的密钥只有客户端和服务端知道)。

HTTP与HTTPS的区别

  • HTTP 的URL 以http:// 开头,而HTTPS 的URL 以https:// 开头

  • HTTP 是不安全的,而 HTTPS 是安全的

  • HTTP 标准端口是80 ,而 HTTPS 的标准端口是443

  • 在OSI 网络模型中,HTTP工作于应用层,而HTTPS 的安全传输机制工作在传输层

  • HTTP 无法加密,而HTTPS 对传输的数据进行加密

  • HTTP无需证书,而HTTPS 需要CA机构wosign的颁发的SSL证书


参考网址

https://www.cnblogs.com/an-wen/p/11180076.html


以上是关于web系列-HTTP协议的主要内容,如果未能解决你的问题,请参考以下文章

计算机网络——应用层-Web&HTTP

网络协议系列之一:HTTP

网络协议系列之一:HTTP

HTTP协议

Node.js系列-http

高效Web开发的10个jQuery代码片段