Web服务器和HTTP的协作&HTTP首部

Posted xdcat

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Web服务器和HTTP的协作&HTTP首部相关的知识,希望对你有一定的参考价值。

用单台虚拟主机实现多个域名

Web服务器可以搭建多个独立域名的Web网站,也可以作为通信路径上的中转服务器提升效率。

HTTP/1.1规范允许一台HTTP服务器搭建多个Web站点,提供Web托管服务的供应商,可以用一台服务器为多为客户服务,也可以以每位客户的域名允许各自不同的网站。

物理层面只有一台服务器,只要使用虚拟主机,即可相当于拥有多台服务器。

客户端通过主机名和域名访问服务器,域名通过DNS服务映射到IP地址后访问目标网站。所以当请求发送到服务器时,已经是以IP地址形式访问了。【如果一台服务器托管了多个域名,收到请求后需要直到访问哪个域名】

例如:www.web1.com 和 www.web2.com部署在一台服务器上,DNS解析后,二者的IP都是服务器的IP:XXX.XXX.XXX.XXX。

当IP地址相同时,由于虚拟主机可以寄存多个不同主机名或域名的web网站,所以发送HTTP请求时,必须在host首部内完整的指定主机名或域名

通信数据转发

HTTP通信中还有一些用于通信转发的应用程序:代理、网关、隧道。可以配合服务器工作。

代理:有转发功能的应用程序,接收客户端的请求,转发给服务端。接收服务端响应,转发给客户端。

网关:转发其他服务器通信数据的服务器,接收从客户端发送来的请求时,像源服务器一样地对请求进行处理。

隧道:相隔很远的客户端和服务器两者之间进行中转,保持双方通信连接的应用程序。

一、代理

基本行为:接收客户端请求,转发给其他服务器。代理不改变URI,直接发送给持有资源的服务器(源服务器)。服务器的响应经由代理发送给客户端。

可以级联多台代理服务器,转发时需要附加Via首部字段,标记经过的主机信息。

技术图片

 

使用代理的优势:利用缓存技术减少网络带宽流量。组织内部针对特定网络的访问控制,获取访问日志。

代理的分类:是否使用缓存、是否会修改报文。

缓存代理:代理在转发响应时,缓存代理预先将资源的副本保存在代理服务器上。下次接收到相同请求时,就可以不从源服务器获取资源,用缓存的资源作为返回。

透明代理:转发请求或响应时,不对报文做任何加工。否则就是非透明代理。

二、网关

网关的优势:

1. 可以使通信线路上的服务器提供非HTTP协议服务。

技术图片

 

 

2. 可以提高通信的安全性,因为客户端和网关之间的通信线路可以加密,确保连接的安全。例如:网关可以连接数据库,使用SQL查询。网关可以和信用卡结算系统联动。

三、隧道

隧道可以按要求建立起一条和其他服务器的通信线路。使用SSL等加密手段进行通信。

隧道的目的:确保客户端和服务端进行安全的通信。

隧道不会解析HTTP协议,请求保持原样中转给服务器,在通信双方断开连接后结束。

技术图片

 

四、资源的缓存

 

代理服务器或客户端的本地磁盘可以保存资源的副本,也就是缓存,利用缓存可以减少对服务器的访问,节省通信流量和通信时间。

当缓存被判定为过期后,会向源服务器确认资源的有效性,如果失效的话,会向源服务器请求新的资源。

 

HTTP首部

一、HTTP报文首部

HTTP的结构 = 报文首部+空行+报文主体

报文首部:客户端和服务端通信的重要信息

报文主体:用户信息/资源信息

技术图片

 

HTTP请求报文

报文首部 = 请求行+请求首部字段+通用首部字段+实体首都字段+else

请求行 = 请求方式 + URI + HTTP版本

HTTP首部字段 = 请求首部字段+通用首部字段+实体首都字段

 

HTTP响应报文

报文首部 = 状态行+响应首部字段+ 通用首部字段+实体首都字段+else

状态行 = HTTP版本+状态码

 

二、HTTP首部字段

首部字段:提供报文主体大小、使用的语言、认证信息等内容

首部字段的结构 —— 首部字段名:字段值

例如:Content-Type: text/html   Keep-Alive: timeout=15, max=100

技术图片

 

技术图片

 

1. 通用首部字段:请求报文和响应报文都会使用

2. 请求首部字段:请求报文中使用,补充请求的附加内容、客户端信息、响应内容相关优先级信息。

3. 响应首部字段:响应报文中使用,补充响应的附加信息,要求客户端附加的额外的内容信息。

4. 实体首部字段:补充资源内容更新时间等和实体相关的信息。

三、HTTP/1.1 通用首部字段

1. Cache-Control

用于操作缓存的工作机制。

Cache-Control: private, max-age=0, no-cache

缓存请求指令
指令 参数 说明
no-cache / 必须向源服务器验证
no-store / 不缓存请求或响应的任何内容
max-age=?[s] 必需 响应的最大时间
max-stale=?[s] 可省略 接收已经过期的响应
min-fresh=?[s] 必需 期望在指定时间内的响应仍有效
no-transform / 代理不可更改媒体类型
only-if-cached / 从缓存获取资源
cache-extension - 新指令标记

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

缓存响应指令
public / 可以向任意方提供响应的缓存
private 可省 仅向特定用户返回响应
no-cache 可省 缓存前必须先确认有效性
no-store / 不缓存
no-transform / 代理不可更改媒体类型
must-revalidate / 可缓存但必须向源服务器确认
proxy-revalidate / 要求中间缓存服务器对缓存的响应有效性进行确认
max-age=[s] 必需 响应的最大值
s-maxage=[s] 必需 公共缓存服务器响应的最大值
cache-extension - 新指令标记

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. 表明是否能缓存的指令

public:表明其他用户也可以利用缓存

private:只有特定用户才能使用缓存

no-cache:防止从缓存中返回过期的资源。客户端设置no-cache则不会接收缓存过的响应,缓存服务器要把请求转发给服务端。服务端设置no-cache则缓存服务器不能对资源进行缓存,也就不需要验证缓存服务器资源的有效性。

Cache-Control:no-cache=Location。客户端接收到有参的首部字段对应的响应报文后不能使用缓存。无参的首部字段可以使用缓存。

注意:no-cache不是不缓存,是不缓存过期的资源。no-store才是不缓存。

3. 指定缓存期限和认证的指令

s-maxage & max-age:前者只能用于供多位用户使用的公共缓存服务器。(一位用户没有任何作用)用了s-maxage会忽略Expires首部字段和max-age指令。

如果没有超期,则发送缓存,如果超期,则向源服务器验证。

min-fresh:要求缓存服务器返回至少还未过指定时间的缓存资源。超过的资源无法作为响应返回。

max-stale:可指示缓存资源,即使过期也照样接收。【有参数,在参数时间内,照样接收,无参数,永久照样接收】

only-if-cached:只在缓存服务器有缓存的时候才返回。没有响应的话返回504 Gateway Timeout

must-revalidate:代理会向源服务器再次验证即将返回的响应缓存目前是否有效。如果代理无法再次获取有效资源,返回504。该指令会忽略max-stale指令。

proxy-revalidate:缓存服务器必需再次验证缓存的有效性。

no-transform:不可以改变实体主体的媒体类型,防止缓存或代理压缩图片等操作。

4. Connection首部字段

作用:控制不再转发给代理的首部字段,管理持久连接。

技术图片

 

HTTP/1.1默认持久连接,Connection:close可以断开连接。

HTTP/1.1之前非持久连接,所以在旧版本上持续连接需要指定Connection:Keep-alive

5. Date首部字段

表明创建HTTP报文的日期和时间

6. Pragma

作为HTTP/1.0的向后兼容 Pragma:no-cache

用于兼容不同的HTTP协议版本

7. Trailer

事先说明报文主体后面写了哪些首部字段。应用于HTTP/1.1版本分块传输编码时。

8. Transfer-Encoding

规定传输报文主体时采用的编码方式(HTTP/1.1只对分块传输编码有效)

9.  Upgrade

用于检测HTTP协议及其他协议是否可以使用更高的版本进行通信,参数值可以用来指定一个完全不同的通信协议。

10. Via

用于追踪客户端与服务端之间的请求和响应报文的传输路径。报文经过代理和网关时,会在首部字段Via中附加该服务器的信息,然后进行转发。

还可以避免请求回环的发生。

11. Warning

HTTP/1.1的warning是从HTTP/1.0的响应头部Retry-After演变过来的。会告知用户一些关于缓存的问题的警告。

警告码:

110:响应已过期

111:再验证失败,代理再验证资源有效性的时候,服务器访问出现问题

112:断开连接

113:试探性过期,响应的使用期超过24小时(有效缓存设定时间大于24小时时)

199:杂项警告:任意的警告内容

214:使用了转换,代理对内容编码或媒体类型执行了某些处理

299:持久杂项警告:任意的警告内容

四、请求首部字段

五、响应首部字段

六、实体首部字段

七、为Cookie服务的首部字段

八、其他首部字段

 

以上是关于Web服务器和HTTP的协作&HTTP首部的主要内容,如果未能解决你的问题,请参考以下文章

HTTP首部解析

HTTP首部解析

七《图解HTTP》- HTTP首部和HTTP协作服务器

一篇文章带你详解 HTTP 协议之报文首部及字段详解(中)

JSP&Servlet

计算机网络:HTTP 和 HTTPS