Fast Paxos的工业实现-ZAB(上)

Posted 2021-04-17 java日常笔记

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Fast Paxos的工业实现-ZAB(上)相关的知识，希望对你有一定的参考价值。

在上一篇文章中，主要介绍了Paxos算法，，文章中提到了"每个提议者在提出提案时都会首先获取到一个具有全局唯一性的、递增的提案编号N"，但是在实际应用中对该N值得操作有可能出现活锁问题。本文将着重介绍下Paxos算法的缺陷以及Fast Paxos的工业实现ZAB。

Paxos的活锁问题

paxos算法在实际工程应用过程中，根据不同的实际需求存在诸多不便之处，所以也就出现了很多对于基本Paxos算法的优化算法，以对Paxos算法进行改进，例如，Multi Paxos、Fast Paxos 、Epaxos。
例如：Paxos算法存在"活锁问题",Fast Paxos 算法对Paxos 算法进行了改进，其只允许一个进程处理写请求，解决了活锁问题。

活锁与死锁

此处有必要介绍下活锁与死锁。

死锁:是指两个或两个以上的进程（或线程）在执行过程中，因争夺资源而造成的一种互相等待的现象，若无外力作用，它们都将无法推进下去。
举例：
1、两个房间得钥匙都在对方的屋子当中。
2、哲学家进餐问题.一张桌子三个哲学家，小抠1、小抠2和小抠3，每个人就分了一根筷子。

死锁具备的条件：

互斥：一个资源只能被一个进程使用---一根筷子只能被一个人使用。

请求与保持：一个进程因为请求资源被阻塞，对获得的资源又保持不放---"你不给我要筷子，我也不给你"

不剥夺：我拿到一个资源，你不能给我抢走了---"你不能耍流氓，把我的筷子抢走"

循环等待：线程a等待b，b等待c，c等待a---"小抠1等待小抠2的筷子，小抠2等待小抠3的筷子"
这四个条件打破一个，死锁问题就解决了。

活锁：任务或者执行者没有被阻塞，由于某些条件没有满足，导致一直重复尝试，失败，尝试，失败。
举例：小A有两块糖，张三、李四、王五分别来抢，倒霉的张三一直尝试就是抢不到，失败，尝试，失败。

活锁和死锁的区别在于，处于活锁的实体是在不断的改变状态，所谓的“活”，而处于死锁的实体表现为等待；活锁有可能自行解开，死锁则不能。

Paxos为什么会产生活锁呢？

Paxos算法中每个进程均可提交提案，但必须要获取到一个全局的唯一编号N，将该N值赋予提案。为了保证N的唯一性，对该N值的操作就必须要放到同步锁(排他锁)中，即，N值就成为了"竞争资源"。若一个进程为了提交提案，一直在不停的申请资源N，但是如果这个进程特别点背，每一次都没有分配给它，此时的该进程就处于"活锁"状态。
有问题就有解决的方法，Fast Paxos算法出现了，它只允许一个进程提交提案，即其具有对N的唯一操作权。该方式解决了"活锁"问题，下面要介绍得ZAB就是Fast Paxos得工业实现。

ZAB协议

ZAB协议简介

ZAB协议是Fast Paxos 算法得一种工业实现算法。
ZAB，Zookeeper Atomic Broadcast，Zookeeper原子消息广播协议，是转为Zookeeper 设计的一种支持崩溃恢复的原子广播协议，在Zookeeper中，主要依赖ZAB协议来实现分布式数据一致性。
当Zookeeper客户端连接到Zookeeper 集群中的一个节点后，若客户端提交的是读请求，那么当前节点就直接根据自己保存的数据对其进行响应，如果是写请求且当前节点不是Leader，那么节点就会将该写请求转发给Leader，Leader会以提案的方式广播该写操作，只要有超过半数节点同意该写操作，则该写操作请求就会被提交，然后Leader 会再次广播给所有订阅者，即Learner ，通知他们同步数据，详见下图：

三类角色

在实际生产中为了避免Zookeeper的单点问题，Zookeeper也是以集群的方式存在的，Zookeeper集群中的角色主要有以下三类：

Leader:Zookeeper集群写请求的唯一处理者，并负责进行投票的发起和决议，更新系统状态。
Follower:接收客户端请求，处理读请求，并向客户端返回结果，将写请求转给Leader；在选Leader过程中参与投票。
Observer:可以理解为阉割版的Follower ，没有选Leader的权利，也没有写操作投票权，其不属于法定人数范围，主要是为了而协助Follower处理更多的读请求。

三种模式

ZAB协议中对zkServer的状态描述有三种模式:恢复模式、同步模式和广播模式，这三种模式并没有十分明显的界限，它们相互交织在一起。

恢复模式：在服务重启过程中，或在Leader崩溃后，就进入了恢复模式，恢复模式主要包含两个阶段；Leader的选举阶段与初始化同步阶段，这两个阶段完成后Zookeeper集群恢复到正常服务状态。
广播模式(对于Leader而言)：广播模式分为两类，初始化广播与更新广播。当Leader被选举出来后，Leader需要将自己拥有但其它Server可能没有的事务及自己的epoch广播给所有的Learner，这是初始化广播。在集群正常服务时，当Leader的事务提案被大多数Follower同意后，Leader会修改自身数据，然后会将修改后的数据广播给其它Learner，这是更新广播。
同步模式(对于Learner而言)：与广播模式相对应，同步模式也分为两类，初始化同步及更新同步，当Leader 选举出来并发布过其初始化广播后，所有Learner 需要将Leader 广播的事务及epoch 同步到本地，这称为初始化同步，在集群正常服务时，当Leader发布了更新广播后，Learner 需要将Leader 广播的事务同步到本地，这称为更新同步。

三个数据

在Zookeeper 中有三个很重要的数据：zxid 、epoch 与 xid
zxid为64位长度的Long类型，其中高32位表示纪元epoch，低32位表示事务标识xid，即zxid由两部分构成：epoch 与 xid。
每个Leader都会具有一个不同的 epoch值，表示一个时期、时代。每一次新的选举结束后都会生成一个新的epoch（理解为"我是新的leader，这是我时代"），新的Leader产生，则会更新所有zkServer的zxid中的epoch。
xid则为Zookeeper 的事务id，每一个写操作都是一个事务，都会有一个xid。xid为一个依次递增的流水号。每一个写操作都需要由Leader发起一个提案，由所有Follower 表决是否同意本次写操作，而每个提案都具有一个 zxid。

总结：

本文主要介绍了。Paxos的缺陷，以及Fast Paxos的工业实现ZAB,并简要介绍了提交一个写操作经历的流程，以及Zookeeper集群中的三种模式和三种角色以及三个数据都是什么，对于ZAB并没有介绍完全，下一篇文章中，将会详细介绍当Leader挂掉以后，集群中是怎么选新领导的，集群中又是怎么同步新领导思想的。

以上是关于Fast Paxos的工业实现-ZAB(上)的主要内容，如果未能解决你的问题，请参考以下文章