分布式事务篇——第二章:分布式事务解决之2PC剖析
Posted 风清扬逍遥子
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分布式事务篇——第二章:分布式事务解决之2PC剖析相关的知识,希望对你有一定的参考价值。
前面已经学习了分布式事务的基础理论,以理论为基础,针对不同的分布式场景业界常见的解决方案有2PC、 TCC、可靠消息最终一致性、最大努力通知这几种。本文主要着重剖析2PC的方案和落地!!
1、什么是2PC
2PC即两阶段提交协议,是将整个事务流程分为两个阶段,准备阶段(Prepare phase)、提交阶段(commit phase),2是指两个阶段,P是指准备阶段,C是指提交阶段。
举个例子:张三和李四好久不见,老友约起自助餐,饭店老板要求先买单,才能出票。这时张三和李四分别抱怨近况不如意,囊中羞涩,都不愿意请客,这时只能AA。
老板等张三和李四都付款,才能出票安排就餐。但由于张三和李四都是铁公鸡,形成了尴尬的一幕:
准备阶段(Prepare):老板要求张三付款,张三付款。老板要求李四付款,李四付款。
提交阶段(Commit):老板出票,两人拿票纷纷落座就餐。
那么这个例子就形成了一个分布式事务的场景,形成了一个事务,若张三或李四其中一人拒绝付款,或钱不够,店老板都不会给出票,并且会把已收款退回。
在2PC中,整个事务过程由事务管理器和参与者组成,老板就是事务管理器,张三、李四就是事务参与者,事务管理器负责决策整个分布式事务的提交和回滚,事务参与者负责自己本地事务的提交和回滚。
在计算机中部分关系数据库如Oracle、mysql支持两阶段提交协议,如下图:
RM是Resource Manager,叫做资源管理器,TM是Transaction Manager事务管理器,RM我们就理解为数据库的事务管理器;TM一般是内嵌在应用中的。
1. 准备阶段(Prepare phase):事务管理器给每个参与者发送Prepare消息,每个数据库参与者在本地执行事务,并写本地的Undo/Redo日志,此时事务没有提交。(Undo日志是记录修改前的数据,用于数据库回滚,Redo日志是记录修改后的数据,用于提交事务后写入数据文件)
2. 提交阶段(commit phase):如果事务管理器收到了参与者的执行失败或者超时消息时,直接给每个参与者 发送回滚(Rollback)消息;否则,发送提交(Commit)消息;参与者根据事务管理器的指令执行提交或者回滚操作,并释放事务处理过程中使用的锁资源。注意:必须在最后阶段释放锁资源。
成功的情况:
如果失败的话,资源2迟迟不给事务管理器响应,或者给了一个错误码比如数据库繁忙,压力大等因素。
2、XA方案
2PC是个思想,那么针对2PC业内给出另一个解决方案,叫做XA方案。
2PC的传统方案是在数据库层面实现的,如Oracle、MySQL都支持2PC协议,为了统一标准减少行业内不必要的对 接成本,需要制定标准化的处理模型及接口标准,国际开放标准组织Open Group定义了分布式事务处理模型 DTP(Distributed Transaction Processing Reference Model)。
为了让大家更明确XA方案的内容程,下面新用户注册送积分为例来说明:
执行流程如下:
1、应用程序(AP)持有用户库和积分库两个数据源。
2、应用程序(AP)通过TM通知用户库RM新增用户,同时通知积分库RM为该用户新增积分,RM此时并未提交事务,此时用户和积分资源锁定。
3、TM收到执行回复,只要有一方失败则分别向其他RM发起回滚事务,回滚完毕,资源锁释放。
4、TM收到执行回复,全部成功,此时向所有RM发起提交事务,提交完毕,资源锁释放。
DTP模型定义如下角色:
AP(Application Program):即应用程序,可以理解为使用DTP分布式事务的程序。
RM(Resource Manager):即资源管理器,可以理解为事务的参与者,一般情况下是指一个一个的数据库实例,通过资源管理器对该数据库进行控制,资源管理器控制着分支事务。
TM(Transaction Manager):事务管理器,负责协调和管理事务,事务管理器控制着全局事务,管理事务生命 周期,并协调各个RM。全局事务是指分布式事务处理环境中,需要操作多个数据库共同完成一个工作,这个 工作即是一个全局事务。
DTP(Distributed Transaction Processing)模型定义TM和RM之间通讯的接口规范叫XA,简单理解为数据库提供的2PC接口协议,基于数据库的XA 协议来实现2PC又称为XA方案。
以上三个角色之间的交互方式如下:
1)TM向AP提供 应用程序编程接口,AP通过TM提交及回滚事务。
2)TM交易中间件通过XA接口来通知RM数据库事务的开始、结束以及提交、回滚等。
总结下:整个2PC的事务流程涉及到三个角色AP、RM、TM。AP指的是使用2PC分布式事务的应用程序;RM指的是资源管理器,它控制着分支事务;TM指的是事务管理器,它控制着整个全局事务。
3、Seata方案
讲完了XA,讲讲这个比较主流的2PC实现方案——Seata
Seata是由阿里中间件团队发起的开源项目Fescar,后更名为Seata,它是一个是开源的分布式事务框架。 传统2PC的问题在Seata中得到了解决,它通过对本地关系数据库的分支事务的协调来驱动完成全局事务,是工作 在应用层的中间件。主要优点是性能较好,且不长时间占用连接资源,它以高效并且对业务0侵入的方式解决微服 务场景下面临的分布式事务问题,它目前提供AT模式(即2PC)及TCC模式的分布式事务解决方案。
Seata的设计思想如下:
Seata的设计目标其一是对业务无侵入,因此从业务无侵入的2PC方案着手,在传统2PC的基础上演进,并解决 2PC方案面临的问题。所以Seata受到大家的青睐主要原因是:无侵入!!就是不需要你手动写业务代码。
Seata把一个分布式事务理解成一个包含了若干分支事务的全局事务。全局事务的职责是协调其下管辖的分支事务达成一致,要么一起成功提交,要么一起失败回滚。此外,通常分支事务本身就是一个关系数据库的本地事务,下图是全局事务与分支事务的关系图:
与 传统2PC的模型类似,Seata定义了3个组件来协议分布式事务的处理过程:
图里可以看到三个部分,分别是TM,RM,TC
- Transaction Coordinator (TC): 事务协调器,它是独立的中间件,需要独立部署运行,它维护全局事务的运 行状态,接收TM指令发起全局事务的提交与回滚,负责与RM通信协调各各分支事务的提交或回滚。(记住独立部署)
- Transaction Manager (TM): 事务管理器,TM需要嵌入应用程序中工作,它负责开启一个全局事务,并最终向TC发起全局提交或全局回滚的指令。
- Resource Manager (RM): 控制分支事务,负责分支注册、状态汇报,并接收事务协调器TC的指令,驱动分支(本地)事务的提交和回滚。(对比我们讲的2PC的RM)
这里我依旧使用注册用户,送积分的案例举例Seata的分布式事务过程:
用户具体的执行流程如下:
1. 用户服务的TM(事务管理器)向TC(事务协调器)申请开启一个全局事务,全局事务创建成功并生成一个全局唯一的XID。
2. 用户服务的RM(资源管理器)向TC(事务管理器)注册分支事务,该分支事务在用户服务执行新增用户逻辑,并将其纳入XID对应全局事务的管辖。
3. 用户服务执行分支事务,向用户表插入一条记录。
4. 逻辑执行到远程调用积分服务时(XID在微服务调用链路的上下文中传播)。积分服务的RM 向TC 注册分支事务,该分支事务执行增加积分的逻辑,并将其纳入 XID 对应全局事务的管辖。
5. 积分服务执行分支事务,向积分记录表插入一条记录,执行完毕后,返回用户服务。
6. 用户服务分支事务执行完毕。
7. TM 向 TC 发起针对 XID 的全局提交或回滚决议。
8. TC 调度 XID 下管辖的全部分支事务完成提交或回滚请求。
以上就是用户服务和积分服务的具体流程,那么Seata实现2PC和传统的2PC的区别在哪里呢?
架构层次方面,传统2PC方案的 RM 实际上是在数据库层,RM本质上就是数据库自身,通过 XA 协议实现,而 Seata的 RM 是以jar包的形式作为中间件层部署在应用程序这一侧的。
两阶段提交方面,传统2PC无论第二阶段的决议是commit还是rollback,事务性资源的锁都要保持到Phase2完成才释放。而Seata的做法是在阶段1的时候,就将本地事务提交,这样就可以省去Phase2持锁的时间,整体提高效率。
下面我们用Seata模拟2PC提交的案例
4、Seata实现2PC事务
4.1、业务说明
本示例通过Seata中间件实现分布式事务,模拟2个账户的转账交易过程。 两个账户在2个不同的银行(张三在bank1、李四在bank2),bank1和bank2是两个微服务。交易过程是,张三给李四转账指定金额,上述交易步骤,要么一起成功,要么一起失败,必须是一个整体性的事务。
4.2、程序组成部分
- 数据库:MySQL-5.7.x,包括zhangsan_bank和lisi_bank两个数据库。
- JDK:64位 jdk1.8.0_201
- 微服务框架:spring-boot-2.1.3、spring-cloud-Greenwich.RELEASE
- Seata客户端(RM、TM):spring-cloud-alibaba-seata-2.1.0.RELEASE
- seata服务端(TC):seata-server-0.7.1
- 微服务三个:张三微服务,李四微服务,注册中心eureka
技术架构如下:
交互流程如下:
1、请求zhangsan_bank进行转账,传入转账金额。
2、zhangsan_bank减少转账金额,调用lisi_bank,增加转账金额。
4.3、创建数据库
创建张三数据库
/* SQLyog Ultimate v13.1.1 (64 bit) MySQL - 5.7.33-log : Database - zhangsan_bank ********************************************************************* */ /*!40101 SET NAMES utf8 */; /*!40101 SET SQL_MODE=''*/; /*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */; /*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */; /*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */; /*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */; CREATE DATABASE /*!32312 IF NOT EXISTS*/`zhangsan_bank` /*!40100 DEFAULT CHARACTER SET utf8 */; USE `zhangsan_bank`; /*Table structure for table `account_info` */ DROP TABLE IF EXISTS `account_info`; CREATE TABLE `account_info` ( `id` bigint(20) NOT NULL AUTO_INCREMENT, `account_name` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '户\\r\\n主姓名', `account_no` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '银行\\r\\n卡号', `account_password` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '帐户密码', `account_balance` double DEFAULT NULL COMMENT '帐户余额', PRIMARY KEY (`id`) USING BTREE ) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8 COLLATE=utf8_bin ROW_FORMAT=DYNAMIC; /*Data for the table `account_info` */ insert into `account_info`(`id`,`account_name`,`account_no`,`account_password`,`account_balance`) values (2,'张三的账户','1','',10000), (3,'李四的账户','2',NULL,0); /*Table structure for table `undo_log` */ DROP TABLE IF EXISTS `undo_log`; CREATE TABLE `undo_log` ( `id` bigint(20) NOT NULL AUTO_INCREMENT, `branch_id` bigint(20) NOT NULL, `xid` varchar(100) NOT NULL, `context` varchar(128) NOT NULL, `rollback_info` longblob NOT NULL, `log_status` int(11) NOT NULL, `log_created` datetime NOT NULL, `log_modified` datetime NOT NULL, `ext` varchar(100) DEFAULT NULL, PRIMARY KEY (`id`), UNIQUE KEY `ux_undo_log` (`xid`,`branch_id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; /*Data for the table `undo_log` */ /*!40101 SET SQL_MODE=@OLD_SQL_MODE */; /*!40014 SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS */; /*!40014 SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS */; /*!40111 SET SQL_NOTES=@OLD_SQL_NOTES */;
创建李四数据库
/* SQLyog Ultimate v13.1.1 (64 bit) MySQL - 5.7.33-log : Database - lisi_bank ********************************************************************* */ /*!40101 SET NAMES utf8 */; /*!40101 SET SQL_MODE=''*/; /*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */; /*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */; /*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */; /*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */; CREATE DATABASE /*!32312 IF NOT EXISTS*/`lisi_bank` /*!40100 DEFAULT CHARACTER SET utf8 */; USE `lisi_bank`; /*Table structure for table `account_info` */ DROP TABLE IF EXISTS `account_info`; CREATE TABLE `account_info` ( `id` bigint(20) NOT NULL AUTO_INCREMENT, `account_name` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '户\\r\\n主姓名', `account_no` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '银行\\r\\n卡号', `account_password` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '帐户密码', `account_balance` double DEFAULT NULL COMMENT '帐户余额', PRIMARY KEY (`id`) USING BTREE ) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8 COLLATE=utf8_bin ROW_FORMAT=DYNAMIC; /*Data for the table `account_info` */ insert into `account_info`(`id`,`account_name`,`account_no`,`account_password`,`account_balance`) values (3,'李四的账户','2',NULL,0); /*Table structure for table `undo_log` */ DROP TABLE IF EXISTS `undo_log`; CREATE TABLE `undo_log` ( `id` bigint(20) NOT NULL AUTO_INCREMENT, `branch_id` bigint(20) NOT NULL, `xid` varchar(100) NOT NULL, `context` varchar(128) NOT NULL, `rollback_info` longblob NOT NULL, `log_status` int(11) NOT NULL, `log_created` datetime NOT NULL, `log_modified` datetime NOT NULL, `ext` varchar(100) DEFAULT NULL, PRIMARY KEY (`id`), UNIQUE KEY `ux_undo_log` (`xid`,`branch_id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; /*Data for the table `undo_log` */ /*!40101 SET SQL_MODE=@OLD_SQL_MODE */; /*!40014 SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS */; /*!40014 SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS */; /*!40111 SET SQL_NOTES=@OLD_SQL_NOTES */;
里面不知道有没有发现有个脚本是执行undo_log表的,这个表是Seata框架使用,作为回滚数据的日志。
启动TC(事务协调器):
1、下载seata服务端
地址我放在网盘:提取rk9m百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳固,支持教育网加速,支持手机端。注册使用百度网盘即可享受免费存储空间https://pan.baidu.com/s/1T94b3GE1aiJ5jUW8EwmBYA 2、解压并启动:seata-server.bat -p 8888 -m file
注:其中8888为服务端口号;file为启动模式,这里指seata服务将采用文件的方式存储信息。
3、新建项目结构
这里我就不演示新建了,回头需要自己去gitee上下就可以了。
我把公共的entity和interface放进transaction-api中;
首先我要新建注册中心,这里我选择用eureka,当然你可以用nacos等等
主要的配置文件我这里就不多赘述,不是本章的重点
接着来看两个服务一个张三,一个李四
因为张三要进行扣减钱,核心代码这里看,因为要远程调用李四的转账接口,所以我们通过Feign来实现。
@Transactional @GlobalTransactional public void updateAccountBalance(String accountNo, Double amount) { log.info("zhangsan 转账生成的全局事务id是:{}", RootContext.getXID()); //先扣减张三的金额 accountInfoDao.updateAccountBalance("1", amount * -1); //李四增加金额 String transfer = lisiFeign.transfer(amount); if ("fail to invoke".equals(transfer)) { throw new RuntimeException("调用李四微服务转账异常!!"); } }
对于张三的mapper,也很简单。
业务上我想大家都可以写出来,但是关键有个点,在张三和李四的微服务里要加两个配置文件,是Seata相关的配置文件,一个是file.conf,一个是registry.conf
registry.conf里面我们只要保证这个值就可以了
file.conf里面有两个点, 在file.conf中更改
service.vgroup_mapping.[springcloud服务名]-fescar-service-group = "default"
并修改 service.default.grouplist =[seata服务端地址]
比如张三的微服务名称叫做seata-2pc-zhangsan,那么就这么配置
其他的配置暂时不需要动
default.grouplist = Seata Server集群地址,这里是127.0.0.1:8888
同样在李四的微服务中别忘记配置这两个文件
接下来创建代理数据源,新增DatabaseConfiguration.java,Seata的RM通过DataSourceProxy才能在业务代码的事务提交时,通过这个切入点,与TC进行通信交互、记录undo_log等。
@Configuration public class DatabaseConfiguration { private final ApplicationContext applicationContext; public DatabaseConfiguration(ApplicationContext applicationContext) { this.applicationContext = applicationContext; } @Bean @ConfigurationProperties(prefix = "spring.datasource.ds0") public DruidDataSource druidDataSource() { DruidDataSource druidDataSource = new DruidDataSource(); return druidDataSource; } @Primary @Bean public DataSource dataSource(@Qualifier("druidDataSource") DruidDataSource druidDataSource) { DataSourceProxy dataSourceProxy = new DataSourceProxy(druidDataSource); return dataSourceProxy; } }
同样李四的核心业务
@Service @Slf4j public class AccountInfoServiceImpl implements AccountInfoService { @Autowired private AccountInfoDao accountInfoDao; /** * 李四到账 * * @param accountNo * @param amount */ @Transactional public void updateAccountBalance(String accountNo, Double amount) { log.info("bank2 service begin,XID:{}", RootContext.getXID()); //李四增加金额 accountInfoDao.updateAccountBalance(accountNo, amount); } }
整个业务其实比较简单,那么Seata的执行流程是什么样的呢?
正常提交流程:
过程中一旦出现异常回滚流程:比如几个场景
张三扣钱的时候,远程调用李四服务异常,上报TC我扣减失败了,那么TC说,张三要回滚
张三扣钱的时候,调用李四的服务成功,但是李四写数据失败告诉TC,李四扣钱但是事务提交失败,告诉TC,回滚张三,李四的钱
张三扣钱提交事务,上报TC协调器说我写失败了,李四也提交事务失败,一样全部回滚。
要点说明:
1、每个RM使用DataSourceProxy连接数据库,其目的是使用ConnectionProxy,使用数据源和数据连接代理的目的就是,第一阶段将undo_log和业务数据放在一个本地事务提交,这样就保存了只要有业务操作就一定有undo_log。
2、在第一阶段undo_log中存放了数据修改前和修改后的值,为事务回滚作好准备,所以第一阶段完成就已经将分支事务提交,也就释放了锁资源。
3、TM开启全局事务开始,将XID全局事务id放在事务上下文中,通过feign调用也将XID传入下游分支事务,每个分支事务将自己的Branch ID分支事务ID与XID关联。
4、第二阶段全局事务提交,TC会通知各各分支参与者提交分支事务,在第一阶段就已经提交了分支事务,这里各参与者只需要删除undo_log即可,并且可以异步执行,第二阶段很快可以完成。
5、第二阶段全局事务回滚,TC会通知各各分支参与者回滚分支事务,通过 XID 和 Branch ID 找到相应的回滚日志,通过回滚日志生成反向的SQL 并执行,以完成分支事务回滚到之前的状态,如果回滚失败则会重试回滚操作。
5、启动服务
先启动注册中心,再启动张三和李四的服务,我们进行测试:
- 张三向李四转账成功。
- 李四事务失败,张三事务回滚成功。
zhangsan请求这边我可以加个debug,卡在执行李四的service上,就可以看到了
undo_log有这条日志。
- 张三事务失败,李四事务回滚成功。
- 分支事务超时测试。
那么相关的异常可以自己调试,代码我贴出来:
distributed-transaction: 分布式事务https://gitee.com/cx_gitee/distributed-transaction.git
本章比较简单,这里就不多说了,看代码相信同学一定可以知道过程,下一章我们深度剖析TCC!!
以上是关于分布式事务篇——第二章:分布式事务解决之2PC剖析的主要内容,如果未能解决你的问题,请参考以下文章