HTTP协议及其工作流程
Posted 高洛峰
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HTTP协议及其工作流程相关的知识,希望对你有一定的参考价值。
在TCP/IP的模型图中,读者可以看到,HTTP协议位于最上层的应用层,它是互联网上应用最为广泛的一种网络协议,所有的WWW文件都必须遵守这个协议。
HTTP是一个由请求和响应组成的、标准的客户端/服务器端模型(B/S结构)。HTTP协议永远是由客户端发起请求,服务器端给予响应,如图2-8所示。
图2-8 HTTP请求
HTTP是一种无状态协议。无状态是指客户端和服务器端之间不需要建立持久的连接,客户端发起一个请求,服务器端返回响应,这个连接就会被关闭,在服务器端不会保留该请求的有关信息。
HTTP的工作流程如下。
HTTP协议是通过标准URL来请求指定的服务器中的指定服务的。一个标准的URL如下:
http://www.baidu.com:80/index.html?name=tom&age=18
下面来拆分一下URL,看看这些组成都是做什么的:
(1)http:协议类型。这里指的是要发送的是什么协议,还可以是FTP等其他协议。而这里请求的是服务器中的网页,所以使用的是常见的HTTP协议。
(3)80:端口号。用户已经可以通过域名或者IP访问到一台服务器了,但是一台服务器里有那么多的服务和应用,怎样才能准确找到用户需要访问的那个服务或应用呢?在服务器中,每个服务和应用都会开启一个进程,都会有一个进程号(PID),如果对外提供服务,则还会有一个唯一的端口号,这让外部应用可以直接通过这个端口号访问到指定的服务和应用。端口号的范围是0~65 535,一些常用的服务和应用都有默认的端口号,一般不能轻易更改,比如Web服务器的80端口、远程连接SSH服务的22端口、数据库mysql的3306端口等等。因为80端口是Web服务器的默认端口,所以在写HTTP请求的URL的时候,80端口一般是省略的。
(4)index.html:请求的文件名。用户通过域名和端口号已经能访问到Web服务器了,接下来就可以通过文件名来访问指定的文件了。Web服务器一般都做好了路由,不同的路由所提供的访问文件的形式可能不一样,但核心都是一样的。
(5)?name=tom&age=18:请求参数。即使同一个网页,可能针对不同的用户,服务器要返回给客户端的信息也是不一样的。而服务器就是通过URL中“?”后面携带的参数不同来响应不同的用户或者同一个用户的不同请求的。
2.封装HTTP请求
这一步会把上面写的URL以及本机的一些信息封装成一个HTTP请求数据包,后面笔者会详细说明。
3.封装TCP包
第三步就是封装TCP包,建立TCP连接,也就是常说的“三次握手”。由于HTTP位于最上层的应用层,所以HTTP在工作之前要先由TCP和IP协议建立网络连接,这就是TCP/IP协议族,因此互联网又被称为TCP/IP网络。
这里介绍一下TCP/IP协议的“三次握手”。首先由客户端发送建立连接的请求,客户端发送一个syn包,等待服务器端的响应;服务器端收到SYN包之后,返回给客户端一个表示确认的SYN包;最后客户端收到确认SYN包之后向服务器端发送ACK包,发送完之后开始建立连接,如图2-9所示。
图2-9 TCP/IP三次握手
4.客户端发送请求命令
第四步就是在连接建立之后,客户端发送HTTP请求到服务器端,与请求相关的信息都会包含在请求头和请求体中发送给服务器端。
5.服务器端响应
服务器在收到请求之后,根据客户端的请求发送给客户端相应的信息。相关的响应信息都会放在响应头和响应体中。
6.关闭连接
服务器端在发送完响应之后,就会关闭连接。如果客户端的请求的头信息中有Connection-alive,那么服务器端在响应完这个请求之后不会关闭连接,直到该客户端的所有请求都响应完毕,才会关闭连接,这样大大节省了带宽和I/O资源。
请求和响应
HTTP请求由两部分组成:HTTP消息头和HTTP消息体。消息头告诉服务器该请求是做什么的,消息体告诉服务器怎么做。比如访问一个页面,头信息可以到浏览器中的调试心去看,而消息体需要用户单击鼠标右键查看源码,那些HTML代码就是服务器返回给客户端的消息体。
HTTP中的请求头由三部分组成:请求行、请求头和请求正文,如图2-10所示。
1.请求行
请求的第一行是请求行,里面有请求方法、URL、协议版本等。比如图2-10,请求的方法是GET,请求的URL是/ ,协议版本是HTTP/1.1。
2.请求头
每个头域都由一个头域名、冒号和值域组成。下面介绍一些常见的头域。
(1)Connetion:表示是否需要持久连接。如果服务器看到它的值为keep-alive,或者请求协议使用的是HTTP/1.1(默认使用持久连接),同一个页面如果包含多个资源,则只会使用一个连接,如Connection:keep-alive。如果设置了Connetion:close,则每一个请求结束都会关闭连接,新的请求又会重新建立连接。一个网页至少有几十个资源请求,这样很浪费带宽和时间。
(3)Accept:浏览器可以接受的媒体类型(MIME类型),如Accept:text/html代表浏览器可以接受HTML文档。“*”代表接受任何类型,如Accept:*/*。
(4)Accept-Encoding:浏览器申明自己接受的编码方法,通常指定压缩方法、是否支持压缩、支持什么格式的压缩。
3.请求正文
也叫请求数据,在使用POST请求提交表单数据的时候,这些表单数据就会被放在HTTP请求的请求正文中,以加密的形式向服务器传输。
节选自《细说AJAX与jQuery》
以上是关于HTTP协议及其工作流程的主要内容,如果未能解决你的问题,请参考以下文章