一文详解如何用 MySQL/Redis/ZooKeeper 实现分布式锁

Posted 2022-11-11 π大星的日常

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了一文详解如何用 MySQL/Redis/ZooKeeper 实现分布式锁相关的知识，希望对你有一定的参考价值。

一个挺着啤酒肚，身穿格子衫，发际线严重后移的中年男子，手拿着保温杯，胳膊夹着 MacBook 向你走来，看样子是架构师级别。

面试开始， 直入正题。

面试官： 你有没有参与过秒杀系统的设计？

我：没有，我平时都是开发后台管理系统、OA 办公系统、内部管理系统，从来没有开发过秒杀系统。

面试官： 嗯...，小伙子很实诚。今天就先到这里吧，后面有消息会主动联系你。

我：参与过秒杀系统，并独立负责过秒杀系统的架构设计（【狗头】是的，都是我设计的）。

面试官： 这样才对，这样我才能接着往下问。你在设计秒杀系统的时候，怎么防止商品超卖？比如活动中只有一台 iPhone，最终卖出 100 台，肯定不行，平台要亏钱。

我：肯定要加锁，不过由于秒杀系统请求量较大，一般使用分布式集群。而 Java 自带 Synchronized、ReentrantLock 锁只能用在单机系统中，这时候就需要用到分布式锁。

面试官： 你提到分布式锁，分布式锁都有哪些作用？

我：我觉得分布式锁主要有两个作用：

保证数据的正确性：比如：秒杀的时候防止商品超卖，表单重复提交，接口幂等性。

避免数据重复处理：比如：调度任务在多台机器重复执行，缓存过期所有请求都去加载数据库。

面试官： 小伙子总结的挺全，你知道设计一个分布式锁，要具有哪些特性？

我：我觉得分布式锁要具有以下这些特性：

互斥：同一时刻只能有一个线程获得锁。可重入：当一个线程获取锁后，还可以再次获取这个锁，避免死锁发生。高可用：当小部分节点挂掉后，仍然能够对外提供服务。高性能：要做到高并发、低延迟。支持阻塞和非阻塞：Synchronized 是阻塞的，ReentrantLock.tryLock()就是非阻塞的支持公平锁和非公平锁：Synchronized 是非公平锁，ReentrantLock(boolean fair)可以创建公平锁

面试官： 小伙子，有点东西。你是怎么设计一个分布式锁？

我：有几种常用的工具都可以实现分布式锁。比如：关系型数据库（例如：mysql）、分布式数据库（例如：Redis）、分布式协调服务框架（例如：zookeeper）

使用 MySQL 实现分布式锁比较简单，建一张表：

CREATE TABLE `distributed_lock` (  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '主键ID',  `resource_name` varchar(200) NOT NULL DEFAULT '' COMMENT '资源名称（唯一索引）',  PRIMARY KEY (`id`),  UNIQUE KEY `uk_resource_name` (`resource_name`)) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='分布式锁';

复制代码

获取锁的时候，就插入一条记录。插入成功就代表获取到锁，插入失败就代表获取锁失败。

INSERT INTO distributed_lock (`resource_name`) VALUES ('资源1');

复制代码

释放锁的时候，就删除这条记录。

DELETE FROM distributed_lock WHERE resource_name = '资源1';

复制代码

实现比较简单，不过还不能用于实际生产中，有几个问题没有解决：

这把锁不支持阻塞，insert 失败立即就返回了。当然可以用 while 循环直到插入成功，不过自旋也会占用 CPU。
这把锁不是可重入的，已经获取到锁的线程再次插入也会失败，我们可以增加两列，一列记录获取到锁的节点和线程，另一列记录加锁次数。获取锁，次数加一，释放锁，次数减一，次数为零就删除这把锁。
这把锁没有过期时间，如果业务处理失败或者机器宕机，导致没有释放锁，锁就会一直存在，其他线程也无法获取到锁。我们可以增加一列锁过期时间，再启动一个异步任务扫描过期时间大于当前时间的锁就删除。

就是这么麻烦，我们看一下优化之后的锁变成什么样了：

CREATE TABLE `distributed_lock` (  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '主键ID',  `resource_name` varchar(200) NOT NULL DEFAULT '' COMMENT '资源名称（唯一索引）',  `owner` varchar(200) NOT NULL DEFAULT '' COMMENT '锁持有者（机器码+线程名称）',  `lock_count` int NOT NULL DEFAULT '0' COMMENT '加锁次数',  `expire_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '锁过期时间',  PRIMARY KEY (`id`),  UNIQUE KEY `uk_resource_name` (`resource_name`)) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='分布式锁';
复制代码

这下应该完美了吧？不行，还有个问题：

业务逻辑没处理完，锁过期了怎么办？

假如我们设置锁过期时间是 6 秒，正常情况下业务逻辑可以在 6 秒内处理完成，但是当 JVM 发生 FullGC 或者调用第三方服务出现网络延迟，业务逻辑还没处理完，锁已经过期，被删掉，然后被其他线程获取到锁，岂不是要出问题？

这就引入了另一个知识点“锁续期”：

获取锁的同时，启动一个异步任务，每当业务执行到三分之一时间，也就是 6 秒中的第 2 秒的时候，就自动延长锁过期时间，继续延长到 6 秒，这样就能保证业务逻辑处理完成之前锁不会过期。

面试官： 小伙子，分布式锁算是让你玩明白了。我还想继续问，生产中一般很少用 MySQL 做分布式锁，因为 MySQL 并发性能跟不上。刚才提到 Redis 也可以实现分布式锁，你知道该怎么实现吗？

我当然知道，八股文就要背全套。

我：使用 Redis 实现分布式锁，跟使用 MySQL 类似，也需要解决实现过程中遇到的各种问题，不过解决方案稍有不同。

最简单的获取锁方式：

// 1. 获取锁redis.setnx('resource_name1', 'owner1')// 2. 释放锁redis.del('resource_name1')
复制代码

当“resource_name1”不存在时，set 成功，也就是获取锁成功。

不过还需要加上过期时间，防止没有释放锁。

// 1. 获取锁redis.setnx('resource_name1', 'owner1')// 2. 增加锁过期时间redis.exprire('resource_name1', 6, TimeUnit.SECONDS)
复制代码

又引入新问题了，两条命令不是原子的，可能获取锁之后还没来得及设置过期时间就宕机了，这该怎么办？

好办，在 Redis 2.6.12 之后，提供一条复合命令：

redis.set('resource_name1', 'owner1',"NX" "EX", 6)

复制代码

还有一个问题，释放锁的时候，并没有判断锁的持有者，有可能把其他线程持有的锁给释放了，这可不行，可以这样做：

// 释放锁if ('owner1'.equals(redis.get('resource_name1')))  redis.del('resource_name1')
复制代码

这样行不行呢？还不行，因为 get 和 del 两条命令不是原子操作，需要引入 Lua 脚本把两条命令打包成一条发给 Redis 执行：

String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";redis.eval(script, Collections.singletonList('resource_name1'), Collections.singletonList('owner1'))
复制代码

这样总行了吧？还不行，还有个“锁续期”的问题没有解决。

更简单了，Redis 客户端 Redisson 已经帮我们实现续期的功能，叫“WatchDog”（看门狗），在我们调用 lock 自动唤醒“看门狗”。

面试官： 小伙子，你可真行啊。你再讲一下使用 zookeeper 怎么实现分布式锁？

我： zookeeper 采用树形节点，类似 Linux 目录文件结构，同一目录下的节点名称不能重复。

节点有分为四种类型：

持久节点： 一旦创建，永久存储在服务器上，除非手动删除。临时节点： 生命周期与客户端绑定，客户端断开连接，节点就被自动删除。持久顺序节点： 特性同持久节点，只是在节点名称后面追加自增有序数字。临时顺序节点： 特性同临时节点，只是在节点名称后面追加自增有序数字。

zookeeper 还有个监听-通知机制，客户端可以在资源节点上创建 watch 事件。当节点发生变化，会通知客户端，客户端可以根据变化做相应的业务处理。

我们可以利用临时顺序节点的特性创建分布式锁，分以下三步：

在资源/resource1 目录下创建临时顺序节点 node
获取/resource1 目录下的所有节点，如果当前节点序号最小，代表加锁成功
如果不是，就是 watch 监听序号最小的节点

实现逻辑很简单，我们来分析一下 zookeeper 实现分布式锁的优点：

由于创建的临时节点，断开连接后自动删除，所以无需设置锁超时时间，也就不用考虑不释放和锁续期
由于节点上存储的创建人信息，锁也就支持可重入
由于可以监听节点，也就实现了可阻塞

面试官： 小伙子，升级加薪的机会就是留给你这样的人。薪资 double，明天就来上班吧。

总结：

关于分布式锁的所有知识点，虽然很多，但都已经总结在这张图上了，欢迎点赞收藏转发评论。

以上是关于一文详解如何用 MySQL/Redis/ZooKeeper 实现分布式锁的主要内容，如果未能解决你的问题，请参考以下文章