缓存淘汰算法系列
Posted 转瞬之夏
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了缓存淘汰算法系列相关的知识,希望对你有一定的参考价值。
一、前言
接着上篇文章,这次继续介绍缓存算法。
二、Clock
1、算法思想
尽管上文介绍的Second-chance算法是一个合理的算法,但是它并不是很高效,因为它频繁需要把对象插入到队列尾部,要知道位移也是很耗时的。而更高效的算法Clock,采用的是一个循环链表,有一个指针指向最早的对象,且每个缓存中的对象都维护一个标记位。
2、工作原理
* 当待缓存对象在缓存中时,无论该对象标记位为0还是1,都设置为1(被使用)。同时,指针指向该对象的下一个对象。
*若不在缓存中时,检查指针指向对象的标记位。如果是0,则用待缓存对象替换该对象;如果是1,则置为0,指针指向下一个对象。如此直到淘汰一个对象为止。
三、Gclock(Generalized clock page replacement algorithm)
1、算法思想
该算法是Clock的变种。相对于Clock标志位采用的是二进制0和1表示,Gclock的标志位采用的是一个整数,意味着理论上可以一直增加到无穷大。
2、工作原理
* 当待缓存对象在缓存中时,把其标记位的值加1。同时,指针指向该对象的下一个对象。
*若不在缓存中时,检查指针指向对象的标记位。如果是0,则用待缓存对象替换该对象;否则,把标记位的值减1,指针指向下一个对象。如此直到淘汰一个对象为止。由于标记位的值允许大于1,所以指针可能循环多遍才淘汰一个对象。
四、WSclock(Working set clock page replacement algorithm)
1、算法思想
该算法同样是clock的变种,可能是实际运用最广泛的算法。它采用clock的原理,是ws算法(不懂的朋友可以阅读ws算法)的增强版。算法数据结构为循环链表,每个缓存对象保存了"最近使用的时间"rt和"是否引用"的R标志位,使用一个周期计时器t。age表示为当前时间和rt的差值
2、工作原理
*当待缓存对象存在缓存中时,更新rt为当前时间。同时,指针指向该对象的下一个对象。
*若不存在于缓存中时,如果缓存没满,则更新指针指向位置的rt为当前时间,R为1。同时,指针指向下一个对象。如果满了,则需要淘汰一个对象。检查指针指向的对象,
(1)R为1,说明对象在working set中,则重置R为0,指针指向下一个对象。
(2)R为0。如果age大于t,说明对象不在working set中,则替换该对象,并置R为1,rt为当前时间。如果age不大于t,则继续寻找淘汰对象。如果回到指针开始的位置,还未寻找到淘汰对象,则淘汰遇到的第一个R为0的对象。
五、LRU-K算法
1、算法思想
LRU-K中的K代表最近使用的次数,因此LRU可以认为是LRU-1。LRU-K的主要目的是为了解决LRU算法“缓存污染”的问题,其核心思想是将“最近使用过1次”的判断标准扩展为“最近使用过K次”。
2、工作原理
相比LRU,LRU-K需要多维护一个队列,用于记录所有缓存数据被访问的历史。只有当数据的访问次数达到K次的时候,才将数据放入缓存。当需要淘汰数据时,LRU-K会淘汰第K次访问时间距当前时间最大的数据。详细实现如下
(1). 数据第一次被访问,加入到访问历史列表;
(2). 如果数据在访问历史列表里后没有达到K次访问,则按照一定规则(FIFO,LRU)淘汰;
(3). 当访问历史队列中的数据访问次数达到K次后,将数据索引从历史队列删除,将数据移到缓存队列中,并缓存此数据,缓存队列重新按照时间排序;
(4). 缓存数据队列中被再次访问后,重新排序;
(5). 需要淘汰数据时,淘汰缓存队列中排在末尾的数据,即:淘汰“倒数第K次访问离现在最久”的数据。
LRU-K具有LRU的优点,同时能够避免LRU的缺点,实际应用中LRU-2是综合各种因素后最优的选择,LRU-3或者更大的K值命中率会高,但适应性差,需要大量的数据访问才能将历史访问记录清除掉。
六、Two queues(2Q)
1、算法思想
该算法类似于LRU-2,不同点在于2Q将LRU-2算法中的访问历史队列(注意这不是缓存数据的)改为一个FIFO缓存队列,即:2Q算法有两个缓存队列,一个是FIFO队列,一个是LRU队列。
2、工作原理
当数据第一次访问时,2Q算法将数据缓存在FIFO队列里面,当数据第二次被访问时,则将数据从FIFO队列移到LRU队列里面,两个队列各自按照自己的方法淘汰数据。详细实现如下:
(1). 新访问的数据插入到FIFO队列;
(2). 如果数据在FIFO队列中一直没有被再次访问,则最终按照FIFO规则淘汰;
(3). 如果数据在FIFO队列中被再次访问,则将数据移到LRU队列头部;
(4). 如果数据在LRU队列再次被访问,则将数据移到LRU队列头部;
(5). LRU队列淘汰末尾的数据。
该算法还有完整版的,具体可参考最后一篇论文
七、参考文献
The Clock Page Replacement Algorithm
Clock page replacement algorithm - Already existing pages
Generalized clock page replacement algorithm
以上是关于缓存淘汰算法系列的主要内容,如果未能解决你的问题,请参考以下文章