让您轻松理解分布式事务解决方案之2PC

Posted 请叫我东子

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了让您轻松理解分布式事务解决方案之2PC相关的知识,希望对你有一定的参考价值。

针对不同的分布式场景业界常见的解决方案有2PCTCC可靠消息最终一致性最大努力通知等。

1. 什么是2PC

2PC两阶段提交协议,是将整个事务流程分为两个阶段,准备阶段(Prepare phase)提交阶段(commit phase),2是指两阶段,P是指准备阶段,C是提交阶段。

举例 :张三和李四好久不见,两人一起约看电影,电影院收银员要求先买单,才能出电影票。这时张三和李四分别抱怨近况不如意,囊肿羞涩,都不愿意请客,这时只能AA。只有张三和李四都付款,老板才能出票安排电影。但由于张三和李四都是铁公鸡,形成两尴尬的一幕 :
准备阶段 :收银员分别要求张三、李四付款付款,张三付款、李四付款。
提交阶段 :收银员出票,两人拿票纷纷进入电影院。
例子中形成两一个事务,若张三或李四其中一个拒绝付款,或钱不够,店老板都不会给出票,并且会把已收款退回。
整个事务过程由事务管理器和参与者组成,店老板就是事务管理器,张三、李四就是事务参与者,事务管理器负责决策整个分布式事务的提交和回滚,事务参与者负责自己本地事务的提交和回滚。
在计算机中部分关系数据库如Oracle、mysql支持两阶段提交协议,如下图 :

  1. 准备阶段(Prepare phase):事务管理器给每个参与者发送Prepare消息,每个数据库参与者在本地执行事务,并写本地的Undo/Redo日志,此时事务没有提交。
    (Undo日志是记录修改前的数据,用于数据库回滚,Redo日志是记录修改后的数据,用于提交事务后写入数据文件)
  2. 提交阶段(commit phase):如果事务管理器收到两参与者的执行失败或者超时消息时,直接给每个参与者发送回滚(Rollback)消息;否则,发送提交(Commit)消息;参与者根据事务管理器的指令执行提交或者回滚操作,并释放事务处理过程中使用的锁资源。注意 :必须在最后阶段释放锁资源。

下图展示两2PC的两个阶段,分成功和失败两个情况说明 :
成功情况:

失败情况 :

2. 2PC解决方案

2.1 XA方案

2PC的传统方案是在数据库层面实现的,如Oracle、MySQL都支持2PC协议,为了统一标准减少行业内不必要的对接成本,需要制定标准化的处理模型及接口标准,国际开放标准组织(Open Group)定义分布式事务处理模型DTP(Distributed Transaction Processing Reference Model)。

为了让大家更明确XA方案的内容,下面新用户注册送积分为例来说明

执行流程如下 :

  1. 应用程序(AP)持有用户库和积分库两个数据源。
  2. 应用程序(AP)通过TM通知用户库RM新增用户,同时通知积分库RM为该用户新增积分,RM此时并未提交事务,此时用户和积分资源锁定。
  3. TM收到执行回复,只要有一方失败则分别向其他RM发起回滚事务,回滚完毕,资源锁释放。
  4. TM收到执行回复,全部成功,此时向所有RM发起提交事务,提交完毕,资源锁释放。

DTP模型定义如下角色 :

  • AP(Application Program) : 应用程序,可以理解为使用DTP分布式事务的程序。
  • RM(Resource Manager) : 资源管理器,可以理解为事务的参与者,一般情况下是指一个数据库实例,通过资源管理器对该数据库进行控制,资源管理器控制着分支事务。
  • TM(Transaction Manager) : 事务管理器,负责协调和管理事务,事务管理器控制着全局事务,管理事务生命周期,并协调各个RM。全局事务是指分布式事务处理环境中,需要操作多个数据库共同完成一个工作,这个工作即是一个全局事务。
  • DTP模型定义TM和RM之间通讯的接口规范叫XA,简单理解为数据库提供的2PC接口协议,基于数据库的XA协议来实现2PC又称为XA方案。

以上三个角色之间的交互方式如下 :
1)TM向AP提供应用程序编程接口,AP通过TM提交及回滚事务。
2)TM交易中间件通过XA接口来通知RM数据库事务的开始、结束以及提交、回滚等。

2.1.1 XA方案总结

整个2PC的事务流程涉及到三个角色AP、RM、TM。AP指的是使用2PC分布式事务的应用程序;RM指的是资源管理器,它控制着分支事务;TM指的是事务管理器,它控制着整个全局事务。

  1. 在准备阶段RM执行实际的业务操作,但不提交事务,资源锁定;
  2. 在提交阶段TM会接收RM在准备阶段的执行回复,只要有任一个RM执行失败,TM会通知所有RM执行回滚操作,否则,TM将会通知所有RM提交该事务。提交阶段结束资源锁释放。
2.1.2 XA方案的问题 :
  1. 需要本地数据库支持XA协议。
  2. 资源锁需要等到两个阶段结束才释放,性能较差。

2.2 Seata方案

Seata是阿里中间件团队发起的开源项目Fescar,后更名Seata,它是一个是开源的分布式事务框架。传统2PC的问题在Seata中得到了解决,它通过对本地关系数据库的分支事务的协调来驱动完成全局事务,是工作在应用层的中间件。主要优点是性能较好,且不长时间占用连接资源,它以高效并且对业务零入侵的方式解决微服务场景下面临的分布式事务问题,它目前提供AT模式(即2PC)及TCC模式Saga模式的分布式事务解决方案。

Seata的设计思想如下 :
Seata的设计目标其一是对业务无入侵,因此从业务无入侵的2PC方案着手,在传统2PC的基础上演进,并解决2PC方案面临的问题。
Seata把一个分布式事务理解成一个包含来若干分支事务的全局事务。全局事务的职责是协调其下管辖的分支事务达成一致,要么一起成功提交,要么一起失败回滚。此外,通常分支事务本身就是一个关系数据库的本地事务,下图是全局事务与分支事务的关系图 :


与传统2PC的模型类似,Seata定义了三个组件来协议分布式事务的处理过程 :

  • Transaction Coordinator(TC)事务协调器,它是独立的中间件,需要独立部署运行,它维护全局事务的运行状态,接收- TM指令发起全局事务的提交与回滚,负责与RM通信协调各个分支事务的提交或回滚。
  • Transaction Manager(TM)事务管理器,TM需要嵌入应用程序中工作,它负责开启一个全局事务,并最终向TC发起全局提交或全局回滚的指令。
  • Resource Manager(RM)控制分支事务,负责分支注册、状态汇报,并接收事务协调器TC的指令,驱动分支(本地)事务的提交和回滚。

参考官网中用户购买商品的业务逻辑。整个业务逻辑由4个微服务提供支持:

  • 库存服务:扣除给定商品的存储数量。
  • 订单服务:根据购买请求创建订单。
  • 帐户服务:借记用户帐户的余额。
  • 业务服务:处理业务逻辑。

请求逻辑架构

分布式事务控制的整个流程如下下图:

具体的执行流程如下 :

  1. 业务服务的TMTC申请开启一个全局事务,全局事务创建成功并生成一个全局唯一的XID
  2. 账户服务、订单服务、库存服务分别的RM向TC注册分支事务,该分支事务在用户服务执行新增用户逻辑,并将其纳入XID对应全局事务的管辖。
  3. 库存服务执行分支事务,向库存表更新一条库存记录(减少商品的库存),执行完毕返回给业务服务。
  4. 订单服务执行分支事务,向订单表插入一条订单记录,同时执行到远程调用账户服务时(XID在微服务调用链路的上下文中传播)。账户服务的RM向TC注册分支事务,该分支事务执行减少账户余额的的逻辑,并将其纳入XID对应全局事务的管辖。
    账户服务执行分支事务,向账户表更新一条记录(减少账户余额),执行完毕后,返回订单服务。
  5. 订单服务分支事务执行完毕。
  6. TM向TC发起针对XID的全局提交或回滚决议。
  7. TC调度XID下管辖的全部分支事务完成提交或回滚请求。

Seata实现2PC与传统2PC的比较 :

  1. 架构层次方面,传统2PC方案的RM实际上是在数据库层,RM本质上就是数据库自身,通过XA协议实现,而Seata的RM是以jar包的形式作为中间件层部署在应用程序的这一侧的。
  2. 两阶段提交方面,传统2PC无论第二阶段的决议是commit还是rollbcak事务性资源的锁都要保持到Phase2完成才释放。而Seata的做法是在Phase1就将本地事务提交,这样就可以省去Phase2持锁的时间,整体提高效率

以上是关于让您轻松理解分布式事务解决方案之2PC的主要内容,如果未能解决你的问题,请参考以下文章

一致性协议之2PC,3PC

分布式事务之2PC

分布式事务 -- 最佳实践方案汇总 -- 看这1篇就够了

分布式一致性协议之2PC与3PC

让您轻松理解分布式事务产生的场景

分布式事务之深入理解什么是2PC3PC及TCC协议?