:分布式事务解决之2PC剖析

Posted 风清扬逍遥子

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了:分布式事务解决之2PC剖析相关的知识,希望对你有一定的参考价值。

        前面已经学习了分布式事务的基础理论,以理论为基础,针对不同的分布式场景业界常见的解决方案有2PC、 TCC、可靠消息最终一致性、最大努力通知这几种。本文主要着重剖析2PC的方案和落地!!

1、什么是2PC

        2PC即两阶段提交协议,是将整个事务流程分为两个阶段,准备阶段(Prepare phase)、提交阶段(commit phase),2是指两个阶段,P是指准备阶段,C是指提交阶段。

        举个例子:张三和李四好久不见,老友约起自助餐,饭店老板要求先买单,才能出票。这时张三和李四分别抱怨近况不如意,囊中羞涩,都不愿意请客,这时只能AA。

        老板等张三和李四都付款,才能出票安排就餐。但由于张三和李四都是铁公鸡,形成了尴尬的一幕:

        准备阶段(Prepare):老板要求张三付款,张三付款。老板要求李四付款,李四付款。

        提交阶段(Commit):老板出票,两人拿票纷纷落座就餐。

        那么这个例子就形成了一个分布式事务的场景,形成了一个事务,若张三或李四其中一人拒绝付款,或钱不够,店老板都不会给出票,并且会把已收款退回。

        在2PC中,整个事务过程由事务管理器参与者组成,老板就是事务管理器,张三、李四就是事务参与者,事务管理器负责决策整个分布式事务的提交和回滚,事务参与者负责自己本地事务的提交和回滚。

        在计算机中部分关系数据库如Oracle、mysql支持两阶段提交协议,如下图:

        RM是Resource Manager,叫做资源管理器,TM是Transaction Manager事务管理器,RM我们就理解为数据库的事务管理器;TM一般是内嵌在应用中的。

        1. 准备阶段(Prepare phase):事务管理器给每个参与者发送Prepare消息,每个数据库参与者在本地执行事务,并写本地的Undo/Redo日志,此时事务没有提交。(Undo日志是记录修改前的数据,用于数据库回滚,Redo日志是记录修改后的数据,用于提交事务后写入数据文件)

        2. 提交阶段(commit phase):如果事务管理器收到了参与者的执行失败或者超时消息时,直接给每个参与者 发送回滚(Rollback)消息;否则,发送提交(Commit)消息;参与者根据事务管理器的指令执行提交或者回滚操作,并释放事务处理过程中使用的锁资源。注意:必须在最后阶段释放锁资源。

        成功的情况:

        如果失败的话,资源2迟迟不给事务管理器响应,或者给了一个错误码比如数据库繁忙,压力大等因素。

2、XA方案

        2PC是个思想,那么针对2PC业内给出另一个解决方案,叫做XA方案。

        2PC的传统方案是在数据库层面实现的,如Oracle、MySQL都支持2PC协议,为了统一标准减少行业内不必要的对 接成本,需要制定标准化的处理模型及接口标准,国际开放标准组织Open Group定义了分布式事务处理模型 DTP(Distributed Transaction Processing Reference Model)。

        为了让大家更明确XA方案的内容程,下面新用户注册送积分为例来说明:

        执行流程如下:

        1、应用程序(AP)持有用户库和积分库两个数据源。

        2、应用程序(AP)通过TM通知用户库RM新增用户,同时通知积分库RM为该用户新增积分,RM此时并未提交事务,此时用户和积分资源锁定。

        3、TM收到执行回复,只要有一方失败则分别向其他RM发起回滚事务,回滚完毕,资源锁释放。

        4、TM收到执行回复,全部成功,此时向所有RM发起提交事务,提交完毕,资源锁释放。

        DTP模型定义如下角色:

        AP(Application Program):即应用程序,可以理解为使用DTP分布式事务的程序。

        RM(Resource Manager):即资源管理器,可以理解为事务的参与者,一般情况下是指一个一个的数据库实例,通过资源管理器对该数据库进行控制,资源管理器控制着分支事务。

        TM(Transaction Manager):事务管理器,负责协调和管理事务,事务管理器控制着全局事务,管理事务生命 周期,并协调各个RM。全局事务是指分布式事务处理环境中,需要操作多个数据库共同完成一个工作,这个 工作即是一个全局事务。

        DTP(Distributed Transaction Processing)模型定义TM和RM之间通讯的接口规范叫XA简单理解为数据库提供的2PC接口协议,基于数据库的XA 协议来实现2PC又称为XA方案

         以上三个角色之间的交互方式如下:

        1)TM向AP提供 应用程序编程接口,AP通过TM提交及回滚事务。

        2)TM交易中间件通过XA接口来通知RM数据库事务的开始、结束以及提交、回滚等。

        总结下:整个2PC的事务流程涉及到三个角色AP、RM、TM。AP指的是使用2PC分布式事务的应用程序;RM指的是资源管理器,它控制着分支事务;TM指的是事务管理器,它控制着整个全局事务。

3、Seata方案

        讲完了XA,讲讲这个比较主流的2PC实现方案——Seata

        Seata是由阿里中间件团队发起的开源项目Fescar,后更名为Seata,它是一个是开源的分布式事务框架。 传统2PC的问题在Seata中得到了解决,它通过对本地关系数据库的分支事务的协调来驱动完成全局事务,是工作 在应用层的中间件。主要优点是性能较好,且不长时间占用连接资源,它以高效并且对业务0侵入的方式解决微服 务场景下面临的分布式事务问题,它目前提供AT模式(即2PC)及TCC模式的分布式事务解决方案。

        Seata的设计思想如下:

        Seata的设计目标其一是对业务无侵入,因此从业务无侵入的2PC方案着手,在传统2PC的基础上演进,并解决 2PC方案面临的问题。所以Seata受到大家的青睐主要原因是:无侵入!!就是不需要你手动写业务代码。

        Seata把一个分布式事务理解成一个包含了若干分支事务全局事务。全局事务的职责是协调其下管辖的分支事务达成一致,要么一起成功提交,要么一起失败回滚。此外,通常分支事务本身就是一个关系数据库的本地事务,下图是全局事务与分支事务的关系图:

         与 传统2PC的模型类似,Seata定义了3个组件来协议分布式事务的处理过程:

        图里可以看到三个部分,分别是TM,RM,TC

  • Transaction Coordinator (TC): 事务协调器,它是独立的中间件,需要独立部署运行,它维护全局事务的运 行状态,接收TM指令发起全局事务的提交与回滚,负责与RM通信协调各各分支事务的提交或回滚。(记住独立部署)
  • Transaction Manager (TM): 事务管理器,TM需要嵌入应用程序中工作,它负责开启一个全局事务,并最终向TC发起全局提交或全局回滚的指令。
  • Resource Manager (RM): 控制分支事务,负责分支注册、状态汇报,并接收事务协调器TC的指令,驱动分支(本地)事务的提交和回滚。(对比我们讲的2PC的RM)

        这里我依旧使用注册用户,送积分的案例举例Seata的分布式事务过程:

        用户具体的执行流程如下:

        1. 用户服务的TM(事务管理器)向TC(事务协调器)申请开启一个全局事务,全局事务创建成功并生成一个全局唯一的XID。

        2. 用户服务的RM(资源管理器)向TC(事务管理器)注册分支事务,该分支事务在用户服务执行新增用户逻辑,并将其纳入XID对应全局事务的管辖。

        3. 用户服务执行分支事务,向用户表插入一条记录。

        4. 逻辑执行到远程调用积分服务时(XID在微服务调用链路的上下文中传播)。积分服务的RM 向TC 注册分支事务,该分支事务执行增加积分的逻辑,并将其纳入 XID 对应全局事务的管辖。

        5. 积分服务执行分支事务,向积分记录表插入一条记录,执行完毕后,返回用户服务。

        6. 用户服务分支事务执行完毕。

        7. TM 向 TC 发起针对 XID 的全局提交或回滚决议。

        8. TC 调度 XID 下管辖的全部分支事务完成提交或回滚请求。


        以上就是用户服务和积分服务的具体流程,那么Seata实现2PC和传统的2PC的区别在哪里呢?

        架构层次方面,传统2PC方案的 RM 实际上是在数据库层,RM本质上就是数据库自身,通过 XA 协议实现,而 Seata的 RM 是以jar包的形式作为中间件层部署在应用程序这一侧的。

        两阶段提交方面,传统2PC无论第二阶段的决议是commit还是rollback,事务性资源的锁都要保持到Phase2完成才释放。而Seata的做法是在阶段1的时候,就将本地事务提交,这样就可以省去Phase2持锁的时间,整体提高效率。

        下面我们用Seata模拟2PC提交的案例

4、Seata实现2PC事务

4.1、业务说明

        本示例通过Seata中间件实现分布式事务,模拟2个账户的转账交易过程。 两个账户在2个不同的银行(张三在bank1、李四在bank2),bank1和bank2是两个微服务。交易过程是,张三给李四转账指定金额,上述交易步骤,要么一起成功,要么一起失败,必须是一个整体性的事务。

4.2、程序组成部分

  • 数据库:MySQL-5.7.x,包括zhangsan_bank和lisi_bank两个数据库。
  • JDK:64位 jdk1.8.0_201
  • 微服务框架:spring-boot-2.1.3、spring-cloud-Greenwich.RELEASE
  • Seata客户端(RM、TM):spring-cloud-alibaba-seata-2.1.0.RELEASE
  • seata服务端(TC):seata-server-0.7.1
  • 微服务三个:张三微服务,李四微服务,注册中心eureka

        技术架构如下:

        交互流程如下:

        1、请求zhangsan_bank进行转账,传入转账金额。

        2、zhangsan_bank减少转账金额,调用lisi_bank,增加转账金额。

4.3、创建数据库

        创建张三数据库

/*
SQLyog Ultimate v13.1.1 (64 bit)
MySQL - 5.7.33-log : Database - zhangsan_bank
*********************************************************************
*/

/*!40101 SET NAMES utf8 */;

/*!40101 SET SQL_MODE=''*/;

/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;
CREATE DATABASE /*!32312 IF NOT EXISTS*/`zhangsan_bank` /*!40100 DEFAULT CHARACTER SET utf8 */;

USE `zhangsan_bank`;

/*Table structure for table `account_info` */

DROP TABLE IF EXISTS `account_info`;

CREATE TABLE `account_info` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `account_name` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '户\\r\\n主姓名',
  `account_no` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '银行\\r\\n卡号',
  `account_password` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '帐户密码',
  `account_balance` double DEFAULT NULL COMMENT '帐户余额',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8 COLLATE=utf8_bin ROW_FORMAT=DYNAMIC;

/*Data for the table `account_info` */

insert  into `account_info`(`id`,`account_name`,`account_no`,`account_password`,`account_balance`) values 
(2,'张三的账户','1','',10000),
(3,'李四的账户','2',NULL,0);

/*Table structure for table `undo_log` */

DROP TABLE IF EXISTS `undo_log`;

CREATE TABLE `undo_log` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `branch_id` bigint(20) NOT NULL,
  `xid` varchar(100) NOT NULL,
  `context` varchar(128) NOT NULL,
  `rollback_info` longblob NOT NULL,
  `log_status` int(11) NOT NULL,
  `log_created` datetime NOT NULL,
  `log_modified` datetime NOT NULL,
  `ext` varchar(100) DEFAULT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `ux_undo_log` (`xid`,`branch_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

/*Data for the table `undo_log` */

/*!40101 SET SQL_MODE=@OLD_SQL_MODE */;
/*!40014 SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS */;
/*!40014 SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS */;
/*!40111 SET SQL_NOTES=@OLD_SQL_NOTES */;

        创建李四数据库

/*
SQLyog Ultimate v13.1.1 (64 bit)
MySQL - 5.7.33-log : Database - lisi_bank
*********************************************************************
*/

/*!40101 SET NAMES utf8 */;

/*!40101 SET SQL_MODE=''*/;

/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;
CREATE DATABASE /*!32312 IF NOT EXISTS*/`lisi_bank` /*!40100 DEFAULT CHARACTER SET utf8 */;

USE `lisi_bank`;

/*Table structure for table `account_info` */

DROP TABLE IF EXISTS `account_info`;

CREATE TABLE `account_info` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `account_name` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '户\\r\\n主姓名',
  `account_no` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '银行\\r\\n卡号',
  `account_password` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '帐户密码',
  `account_balance` double DEFAULT NULL COMMENT '帐户余额',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8 COLLATE=utf8_bin ROW_FORMAT=DYNAMIC;

/*Data for the table `account_info` */

insert  into `account_info`(`id`,`account_name`,`account_no`,`account_password`,`account_balance`) values 
(3,'李四的账户','2',NULL,0);

/*Table structure for table `undo_log` */

DROP TABLE IF EXISTS `undo_log`;

CREATE TABLE `undo_log` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `branch_id` bigint(20) NOT NULL,
  `xid` varchar(100) NOT NULL,
  `context` varchar(128) NOT NULL,
  `rollback_info` longblob NOT NULL,
  `log_status` int(11) NOT NULL,
  `log_created` datetime NOT NULL,
  `log_modified` datetime NOT NULL,
  `ext` varchar(100) DEFAULT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `ux_undo_log` (`xid`,`branch_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

/*Data for the table `undo_log` */

/*!40101 SET SQL_MODE=@OLD_SQL_MODE */;
/*!40014 SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS */;
/*!40014 SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS */;
/*!40111 SET SQL_NOTES=@OLD_SQL_NOTES */;

        里面不知道有没有发现有个脚本是执行undo_log表的,这个表是Seata框架使用,作为回滚数据的日志。

        启动TC(事务协调器):

        1、下载seata服务端

        地址我放在网盘:提取rk9m百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳固,支持教育网加速,支持手机端。注册使用百度网盘即可享受免费存储空间https://pan.baidu.com/s/1T94b3GE1aiJ5jUW8EwmBYA        2、解压并启动:seata-server.bat -p 8888 -m file

        注:其中8888为服务端口号;file为启动模式,这里指seata服务将采用文件的方式存储信息。

        3、新建项目结构

        这里我就不演示新建了,回头需要自己去gitee上下就可以了。

        我把公共的entity和interface放进transaction-api中;

        首先我要新建注册中心,这里我选择用eureka,当然你可以用nacos等等

        主要的配置文件我这里就不多赘述,不是本章的重点

        接着来看两个服务一个张三,一个李四

        因为张三要进行扣减钱,核心代码这里看,因为要远程调用李四的转账接口,所以我们通过Feign来实现。

@Transactional
@GlobalTransactional
public void updateAccountBalance(String accountNo, Double amount) 
        log.info("zhangsan 转账生成的全局事务id是:", RootContext.getXID());
        //先扣减张三的金额
        accountInfoDao.updateAccountBalance("1", amount * -1);
        //李四增加金额
        String transfer = lisiFeign.transfer(amount);
        if ("fail to invoke".equals(transfer)) 
            throw new RuntimeException("调用李四微服务转账异常!!");
        
       
    

        对于张三的mapper,也很简单。

         业务上我想大家都可以写出来,但是关键有个点,在张三和李四的微服务里要加两个配置文件,是Seata相关的配置文件,一个是file.conf,一个是registry.conf

         registry.conf里面我们只要保证这个值就可以了

        file.conf里面有两个点, 在file.conf中更改

        service.vgroup_mapping.[springcloud服务名]-fescar-service-group = "default"

        并修改 service.default.grouplist =[seata服务端地址]

        比如张三的微服务名称叫做seata-2pc-zhangsan,那么就这么配置

        其他的配置暂时不需要动

        default.grouplist = Seata Server集群地址,这里是127.0.0.1:8888

        同样在李四的微服务中别忘记配置这两个文件

        接下来创建代理数据源,新增DatabaseConfiguration.java,Seata的RM通过DataSourceProxy才能在业务代码的事务提交时,通过这个切入点,与TC进行通信交互、记录undo_log等。 

@Configuration
public class DatabaseConfiguration 


    private final ApplicationContext applicationContext;

    public DatabaseConfiguration(ApplicationContext applicationContext) 
        this.applicationContext = applicationContext;
    


    @Bean
    @ConfigurationProperties(prefix = "spring.datasource.ds0")
    public DruidDataSource druidDataSource() 
        DruidDataSource druidDataSource = new DruidDataSource();
        return druidDataSource;
    


    @Primary
    @Bean
    public DataSource dataSource(@Qualifier("druidDataSource") DruidDataSource druidDataSource)  
        DataSourceProxy dataSourceProxy = new DataSourceProxy(druidDataSource);
        return dataSourceProxy;
    

        同样李四的核心业务

@Service
@Slf4j
public class AccountInfoServiceImpl implements AccountInfoService 

    @Autowired
    private AccountInfoDao accountInfoDao;

    /**
     * 李四到账
     *
     * @param accountNo
     * @param amount
     */
    @Transactional
    public void updateAccountBalance(String accountNo, Double amount) 
        log.info("bank2 service begin,XID:", RootContext.getXID());
        //李四增加金额
        accountInfoDao.updateAccountBalance(accountNo, amount);
    

        整个业务其实比较简单,那么Seata的执行流程是什么样的呢?

        正常提交流程:

        过程中一旦出现异常回滚流程:比如几个场景

        张三扣钱的时候,远程调用李四服务异常,上报TC我扣减失败了,那么TC说,张三要回滚

        张三扣钱的时候,调用李四的服务成功,但是李四写数据失败告诉TC,李四扣钱但是事务提交失败,告诉TC,回滚张三,李四的钱

        张三扣钱提交事务,上报TC协调器说我写失败了,李四也提交事务失败,一样全部回滚。

        要点说明:

        1、每个RM使用DataSourceProxy连接数据库,其目的是使用ConnectionProxy,使用数据源和数据连接代理的目的就是,第一阶段将undo_log和业务数据放在一个本地事务提交,这样就保存了只要有业务操作就一定有undo_log。

        2、在第一阶段undo_log中存放了数据修改前和修改后的值,为事务回滚作好准备,所以第一阶段完成就已经将分支事务提交,也就释放了锁资源。

        3、TM开启全局事务开始,将XID全局事务id放在事务上下文中,通过feign调用也将XID传入下游分支事务,每个分支事务将自己的Branch ID分支事务ID与XID关联。

        4、第二阶段全局事务提交,TC会通知各各分支参与者提交分支事务,在第一阶段就已经提交了分支事务,这里各参与者只需要删除undo_log即可,并且可以异步执行,第二阶段很快可以完成。

        5、第二阶段全局事务回滚,TC会通知各各分支参与者回滚分支事务,通过 XID 和 Branch ID 找到相应的回滚日志,通过回滚日志生成反向的SQL 并执行,以完成分支事务回滚到之前的状态,如果回滚失败则会重试回滚操作。

5、启动服务

        先启动注册中心,再启动张三和李四的服务,我们进行测试:

  • 张三向李四转账成功。
  • 李四事务失败,张三事务回滚成功。

        zhangsan请求这边我可以加个debug,卡在执行李四的service上,就可以看到了

        undo_log有这条日志。 

  • 张三事务失败,李四事务回滚成功。
  • 分支事务超时测试。

        那么相关的异常可以自己调试,代码我贴出来:
distributed-transaction: 分布式事务https://gitee.com/cx_gitee/distributed-transaction.git        

        本章比较简单,这里就不多说了,看代码相信同学一定可以知道过程,下一章我们深度剖析TCC!!

以上是关于:分布式事务解决之2PC剖析的主要内容,如果未能解决你的问题,请参考以下文章

一致性协议之2PC,3PC

分布式事务之2PC

分布式事务解决方案

常见分布式事务解决方案

分布式事务方案-补充

[转帖]分布式事务之解决方案(XA和2PC)