缓存利器Lua模块下的共享内存

Posted 川西阳光里

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了缓存利器Lua模块下的共享内存相关的知识,希望对你有一定的参考价值。

上一节讲到了worker进程的共享内存,它利用丰富的指令使数据的缓存操作变得非常简单,但它也存在一些缺点。

1.worker进程之间会有锁竞争,在高并发的情况下会增加性能开销。

2.只支持Lua布尔值、数字、字符串和nil类型的数据,无法支持table类型的数据。

3.在读取数据时有反序列化操作,会增加CPU开销。

但瑕不掩瑜,共享内存在Ngx_Lua中作为缓存工具还是非常出色的。笔者在生产环境中,曾多次使用lua_shared_dict的各种特性,并未感受到存在明显的性能问题。但如果读者还是介意这些缺点或需要缓存更复杂的数据的话,可以使用lua-resty-lrucache。


10.2.1 安装lua-resty-lrucache

     lua-resty-lrucache是基于Ngx_Lua的缓存利器,它拥有如下优点。


1.支持更丰富的数据类型,可以把table存放在value中,这对数据结构复杂的业务非常有用。


2.可以预先分配key的数量,不用设置固定的内存空间,在内存的使用上更为灵活。


3.每个worker进程独立缓存,所以当worker进程同时读取同一个key 时不存在锁竞争。


但它与lua_shared_dict相比也有一些缺点:


       1.因为数据不在worker之间共享,所以无法保证在更新数据时,数据在同一时间的不同worker进程上完全一致。


       2.虽然可以支持复杂的数据结构,但可使用的指令却很少,如不支持消息队列功能。


        3.重载nginx配置时,缓存数据会丢失。如果使用lua_shared_dict,则不会如此。


有利就有弊,读者在使用时可以根据自身需求进行选择。lua-resty-lrucache的安装方式和其他的lua-resty模块一样,如下所示:


# git clone https://github.com/openresty/lua-resty-lrucache.git

# cp -r lua-resty-lrucache/lib/resty/lrucache* \

 /usr/local/nginx_1.12.2/conf/lua_modules/resty/


10.2.2 使用lua-resty-lrucache进行缓存的方法

        通过下面的例子来了解一下lua-resty-lrucache的使用方式,首先需要对模块进行加载,方法如下:

local lrucache = require "resty.lrucache"

local lrucache = require "resty.lrucache.pureffi"


        读者在加载lua-resty-lrucache时,需要把上面的2个文件复制到lua_package_path所设置的路径上。它们的作用是一样的,但性能有所区别:resty.lrucache适合用来缓存命中率高或读操作远远大于写操作的缓存业务;resty.lrucache.pureffi适合用来缓存命中率低或需要对key进行频繁增、删操作的缓存业务。请根据业务需求进行选择。

然后,将下面的代码写入test_m.lua中,并将此文件放到lua_package_path的路径下,代码如下:


local _M = {}

local lrucache = require "resty.lrucache"

--在缓存上声明1个1000个key的列表

local cache, err = lrucache.new(1000)

if not cache then

    return error("failed to create the cache: " .. (err or "unknown"))

end

--此函数用来往缓存中存储key/value的值

local function mem_set()

    --set()中的内容从左到右顺序依次是key、value、有效期(2s)

    cache:set("a", 19, 2)

    cache:set("b", {"1","2","3"},0.001)  --支持插入table类型的数据

    return

end

--此函数用来获取缓存里的value。 a即value的值,如果a为nil,则表示value不存在或已过期;如果stale_data有值,也说明value已过期

local function mem_get(key)

    local a,stale_data = cache:get(key)

    return a,stale_data

end

function _M. fromcache ()

    --获取a的值

local a,stale_data  =  mem_get("a")

    --如果a存在,就输出a的值

    if a then

       ngx.say("a: ", a)

    --如果a不存在且stale_data有值,就输出过期的value,并重新执行存储操作,然后再次输出value

    elseif stale_data then

       ngx.say("a 已经过期: " , stale_data)

       mem_set()

       local a_again  =  mem_get("a")

       ngx.say("a: ", a_again )

    --如果a 和 stale_data都不存在,则执行存储操作后再输出value

    else

       ngx.say("no found a")

       mem_set()

       local a_again  =  mem_get("a")

       ngx.say("a: ", a_again )


    end

end

return _M

修改nginx.conf文件,代码如下:

location / {

    content_by_lua_block {

        --加载模块,执行数据的读取操作

        require("test_m").fromcache()

    }

}


重载Nginx配置,执行结果如下:

# curl   'http://testnginx.com/'

no found a

a: 19

[root@testnginx ~]# curl   'http://testnginx.com/'

a: 19

[root@testnginx ~]# curl   'http://testnginx.com/'

a: 19

[root@testnginx ~]# curl   'http://testnginx.com/'

a 已经过期: 19

a: 19


从执行结果可以看出:

        1.第1次请求,因为a没有值,所以先输出“no found a”,然后又执行了存储操作。

        2.第2次请求,因为有缓存值,直接输出value。

        3.第3次请求,仍然有缓存值,直接输出value。

        4.第4次请求,因为为缓存数据设置的有效期很短,此时已经过期,所以输出了过期的value,并再次执行存储操作,又输出了value。

如果尝试重载Nginx配置,会发现每次重启(restart)后a都没有值,因为在重载配置的过程中,缓存数据会丢失。

下面将对lua-resty-lrucache的常见指令进行说明。


new

语法:cache, err = lrucache.new(max_items [, load_factor])

含义:创建1个缓存实例。如果创建失败会返回nil,并将错误信息返回给err。


max_items用来声明缓存key的数量,从这个设置可以看出它虽然没有规定内存的使用大小,但规定了key的数量。


load_factor参数是加载resty.lrucache.pureffi模块时才会用到的,它基于FFI(Foreign Function Interface,外部功能接口)的hash表的负载因子,值的区间在0.1~1之间,默认值是0.5。负载因子与hash数据的读取时间和对内存空间大小的权衡有关,有兴趣的读者可以自行查询相关信息。


set

语法:cache:set(key, value, ttl)

含义:把key/value存储到缓存中。ttl是缓存的有效期,以秒为单位,默认值是0,表示不会过期;支持设置为0.001s。


get

语法:data, stale_data = cache:get(key)

含义:获取指定key的值,如果key不存在或已过期,就返回nil;如果存在过期数据,过期的值会赋值给stale_data。


delete

语法:cache:delete(key)

含义:从缓存中移除指定的key。


flush_all

语法:cache:flush_all(key)

含义:刷新整个缓存区域的数据,等于清空内存中的数据。这种方式比创建新的缓存实例要快得多。



以上是关于缓存利器Lua模块下的共享内存的主要内容,如果未能解决你的问题,请参考以下文章

CUDA 学习共享内存

(转载)linux下的僵尸进程处理SIGCHLD信号Linux环境进程间通信: 共享内存(下)

MySQL内存使用-全局共享

JUC学习之共享模型之内存

JUC学习之共享模型之内存

c_cpp 基于共享内存的双缓存实现