你所应该知道的HTTP——缓存篇

Posted 前端大联盟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了你所应该知道的HTTP——缓存篇相关的知识,希望对你有一定的参考价值。

茫茫人海中与你相遇

相信未来的你不会很差


来源https://segmentfault.com/a/1190000022336086

概述

HTTP协议的缓存是通过6个报文头完成的,通过两层协商使web资源能够不那么频繁地在服务器与客户端之间传递,从而节约了流量,提高浏览速度。
以从客户端到服务器的顺序,第一层协商为Cache-Control与Expires;第二层协商为Last-Modified与Etag。

相关的报文头

Cache-Control

请求/响应报文头,缓存控制字段,也就是用于给资源生命期,是http/1.1引入的属性。
Cache-Control的取值可细分为两类,一类是对缓存有直接决定性的值,他们会导致后续的第二层协商被跳过,包括:no-store、public、private;另一类是类似Expires的值,只是规定了有效期,后续的第二层协商不受影响,包括no-cache、max-age=x、s-maxage=x。

Cache-Control的取值如下:

属性名 说明文字
no-store 不缓存该资源。
no-cache 缓存该资源,可以等价与max-age=0。
max-age=x 请求缓存后的x秒不再发起请求。
s-maxage=x 代理服务器请求源站缓存后的x秒不再发起请求,只对CDN缓存有效。
public 客户端和代理服务器(CDN)都可缓存。
private 只有客户端可以缓存。

形如:

Cache-Control:max-age=0

Expires

响应报文头,代表资源过期时间,由服务器返回提供,是http1.0的属性,在与Cache-Control共存的情况下,优先级要低。
Expires的功能基本与Cache-Control的max-age相似,但它是指定一个过期时间点,而Cache-Control的max-age是指定了过期前的秒数。

形如:

Expires:Fri, 10 Apr 2020 16:30:04 GMT

Last-Modified

响应报文头,资源最新修改时间,由服务器告诉浏览器。

形如:

Last-Modified:Mon, 23 Mar 2020 18:39:50 GMT

If-Modified-Since

请求报文头,与Last-Modified相对应,浏览器把服务器最后一次给的Last-Modified返回,服务器将以此进行对比,判断资源是否需要更新。

形如:

If-Modified-Since:Fri, 10 Apr 2020 14:45:24 GMT

Etag

响应报文头,资源内容唯一标识,由服务器告诉浏览器。
Etags是HTTP/1.1标准开始引入的,对Last-modified的补充。

主要原因:

  1. 一些周期性修改的文件,修改时间变了但内容没变,此时不希望重新获取;

  2. 一些文件修改非常频繁,比如1秒内修改了多次,Last-modified只能精确到秒;

  3. 一些服务器不能得到文件修改的精确时间。

形如

Etag:58b66ccbe349d0d931df877c00d8101d037243dc

If-None-Match

请求报文头,与Etag相对应,浏览器把服务器最后一次给的Etag返回,服务器将以此进行对比,判断资源是否需要更新。

形如:

If-None-Match:58b66ccbe349d0d931df877c00d8101d037243dc

协商流程

以下假定资源已经获取过一次,并且运行在HTTP/1.1环境下,现在进行二次访问。

流程图如下:
你所应该知道的HTTP——缓存篇

说明:

  • 客户端是有可能因为缓存原因不向服务器发起任何请求的,图中200状态(from cache)就是这种情况。

  • 服务器根据回传的If-Modified-Since与Last-Modified比对,如果不同则说明这个文件修改过,需要更新。但在这种判断精度是秒,如果是一秒内的改动,就需要进一步对比回传的If-None-Match与ETag的值。

  • 服务器返回304的意思就是不需要重新获取新资源,直接使用本地缓存即可。

缓存多久合适

生存时间(TTL)指令告诉浏览器应该缓存某个资源多久,即Cache-Control或Expires的值。
找到给定资源的最佳TTL值并没有完美的科学方法,只能凭经验给出一些指导原则。

指导原则:

  • 纯静态内容,例如图片或带版本的数据,可以在客户端永久缓存;

  • CSS/JS和个性化资源,缓存时间大约是会话(交互)平均时间的两倍;

  • 其他类型资源取决于新数据对旧数据的容忍极限。

浏览器操作对HTTP缓存的影响

用户操作 Expires/Cache-Control Last-Modified/Etag
地址栏回车 有效 有效
页面链接跳转 有效 有效
新开窗口 有效 有效
前进、后退 有效 有效
F5刷新 无效 有效
Ctrl+F5刷新 无效 无效

缓存改进方案

  • md5/hash缓存:通过不缓存html,为静态文件添加MD5或者hash标识,解决浏览器无法跳过缓存过期时间主动感知文件变化的问题。

  • CDN缓存:CDN是构建在网络之上的内容分发网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取所需内容,降低网络拥塞,提高用户访问响应速度和命中率。



你所应该知道的HTTP——缓存篇

我们在虚拟的空间与你相遇,期待可以碰撞出不一样的火花


公众号ID:前端大联盟

扫码关注最新动态




以上是关于你所应该知道的HTTP——缓存篇的主要内容,如果未能解决你的问题,请参考以下文章

从 Apollo 缓存中读取特定类型的所有片段

你所不知道的堆外缓存

[入门篇] HTTP 缓存 概念

JAVA格物致知基础篇:你所不知道的返回码

C#线程篇---你所不知道的线程池

Steve Lin:如何撰写一篇优秀的SIGGRAPH论文