剖析Spring多数据源

Posted 2021-04-29 田守枝的技术博客

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了剖析Spring多数据源相关的知识，希望对你有一定的参考价值。

点击上方"田守枝的技术博客"，关注我

在实际开发中，经常会遇到应用要访问多个库的情况，需要配置多个数据源。本文会介绍spring多数据源的典型场景，如何优雅的实现多数据源，并结合spring、mybatis源码进行分析，为什么在事务中，不能切换数据源。最后，还会提供一个多数据源的完整源码案例。

1 多数据源的典型使用场景

在实际开发中，经常可能遇到在一个应用中可能需要访问多个数据库的情况，以下是两种典型场景。

1.1 业务复杂

数据分布在不同的数据库中，笔者见过一个相对比较复杂的业务，一个业务中同时操作了9个库，业务代码需要根据用户不同的操作，去访问不同的库。

1.2 读写分离

一些规模较小的公司，没有使用数据库访问层中间件。使用多数据源来实现简单的读写分离功能。

剖析Spring多数据源

这里的架构与上图类似。不同的是，在读写分离中，主库和从库的数据库是一致的(不考虑主从延迟)。数据更新操作(insert、update、delete)都是在主库上进行，主库将数据变更信息同步给从库。在查询时，可以在从库上进行，从而分担主库的压力。

需要注意的是，使用多数据源实现的读写分离操作，需要开发人员自行判断执行的sql是读还是写。如果使用了数据库访问层中间件，通常会有中间件来实现读写分离的逻辑，对业务更加透明。

2 如何实现多数据源

对于大多数的java应用，都使用了spring框架，spring-jdbc模块提供了 AbstractRoutingDataSource，其内部可以包含了多个DataSource，然后在运行时来动态的访问哪个数据库。这种方式访问数据库的架构图如下所示：

剖析Spring多数据源

应用直接操作的是AbstractRoutingDataSource的实现类，告诉AbstractRoutingDataSource访问哪个数据库，然后由AbstractRoutingDataSource从事先配置好的数据源(ds1、ds2)选择一个，来访问对应的数据库。

关于如何利用AbstractRoutingDataSource实现多数据源访问，各种博客已经很多，基本功能都能实现，但是易用性不够好，要修改大量代码，业务侵入性太强。

这也是笔者为什么写这篇文章的原因，这里提供了一种更加简单易用的多数据源实现，笔者称之为 RoutingDataSource。在读者对sprign-aop不是很了解的情况下，也能非常容易上手。而且笔者将这个组件发布到了maven中央仓库，因此你可以直接pom.xml中进行引用。

<dependency>    <groupId>io.github.tianshouzhi</groupId>    <artifactId>routing-datasource</artifactId>    <version>1.0.0</version></dependency>

routing-datasource中，最重要的就是以下两个组件：RoutingDataSource类：其继承了spring的AbstractRoutingDataSource，内部管理了多个数据源。支持按照package(包名)，指定这个包下面的类都访问方某个库。@Routing注解：可以添加在类或接口上，也可以添加在方法上，实现更精确的数据源选择控制。另外值得一提的是，@Routing注解支持与spring事务整合。

3 RoutingDataSource配置

假设我们有2个库，db1(包含user表)，db2(包含user_account表)，如下

#数据库：db1CREATE DATABASE `db1`;USE `db1`;CREATE TABLE `user` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(255) NOT NULL, `age` int(11) DEFAULT NULL, PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8;
#数据库：db2CREATE DATABASE `db2`;USE `db2`;CREATE TABLE `user_account` ( `id` int(11) unsigned NOT NULL AUTO_INCREMENT, `account` varchar(255) COLLATE utf8mb4_unicode_ci DEFAULT NULL, PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

接着，我们需要配置2个数据源分别来访问这个库，任何实现JDBC规范的数据源都可以(druid、c3p0、dbcp、tomcat-jdbc等)。

<!--配置ds1，访问数据库db1--><bean id="ds1" class="org.apache.ibatis.datasource.pooled.PooledDataSource"> <property name="username" value="root"/> <property name="password" value="shxx12151022"/> <property name="url" value="jdbc:mysql://localhost:3306/db1"/> <property name="driver" value="com.mysql.jdbc.Driver"/></bean><!--配置ds2，访问数据库db2--><bean id="ds2" class="org.apache.ibatis.datasource.pooled.PooledDataSource"> <property name="username" value="root"/> <property name="password" value="shxx12151022"/> <property name="url" value="jdbc:mysql://localhost:3306/db2"/> <property name="driver" value="com.mysql.jdbc.Driver"/></bean>

接下来，我们需要将这两个数据源交给RoutingDataSource管理。

<!--配置RoutingDataSource，其管理了ds1和ds2--><bean id="routingDataSource" class="io.github.tianshouzhi.routing.RoutingDataSource"> <property name="targetDataSources"> <map> <!--entry的key，将在稍后将看到的@Routing注解中使用到--> <entry key="ds1" value-ref="ds1"/> <entry key="ds2" value-ref="ds2"/> </map> </property> <!--配置默认数据源，在RoutingDataSource无法确定使用哪个数据源时，将会使用默认的数据源--> <property name="defaultTargetDataSource" value="ds1"/></bean>

在实际开发中，我们通常不会直接操作数据源，而是与ORM框架进行整合，这里选用mybatis，因此需要添加mybatis相关配置

<!--配置mybatis的SqlSessionFactoryBean，注入datasource属性引用的是routingDataSource--><bean id="sqlSessionFactory" class="org.mybatis.spring.SqlSessionFactoryBean"> <property name="dataSource" ref="routingDataSource”/> <!--注意，如果你sql写在xml中，需要打开以下配置，本案例写在映射器接口上--> <!--<property name="mapperLocations" value="classpath*:config/sqlmap/**/*.xml" />--></bean><!--配置MapperScannerConfigurer--><bean class="org.mybatis.spring.mapper.MapperScannerConfigurer"> <property name="sqlSessionFactoryBeanName" value="sqlSessionFactory"/> <!--UserMapper和UserAccountMapper位于此包中--> <property name="basePackage" value="io.github.tianshouzhi.routing.mapper"/></bean>

另外，我们编写了2个mybatis映射器(源码见后文)：UserMapper和UserAccountMapper，分别用于访问db1.user表和db2.user_account表。之后我们就可以通过这两个接口上添加 @Routing注解，来让其访问不同的库。

4 @Routing注解的基本使用

@Routing可以在方法上使用，也可以在类或者接口上使用，以下是Routing注解的使用说明。

4.1 方法上添加@Routing注解

public interface UserMapper {   @Routing("ds1") //通过@Routing注解，指定此方法走ds1数据源   public User selectById(@Param("id") int id);    //未添加注解，将走默认的数据源 public int insert(User user);}

上述接口定义了2个方法：

selectById方法：添加了@Routing("ds1")注解，表示通过其访问数据库，都会选择ds1数据源。

insert方法：没有添加注解，因此将走默认的数据源。也就是前面配置RoutingDataSource时，指定的ds1。

4.2 接口或类上添加@Routing注解

例如我们在UserAccountMapper接口上定义了@Routing注解，接口中定义的2个方法都会走ds2数据源访问db2，而user_account位于db2中：

@Routing("ds2")public interface UserAccountMapper { UserAccount selectById(@Param("id") int id); int insert(UserAccount userAccount);}

提示：通常我们一个Mapper接口操作的都是某个库中的表，因此建议直接在接口上添加@Routing注解，而不是每个方法单独添加。(读写分离操作除外)

4.3 接口、方法上都添加@Routing注解

@Routing("ds2")public interface UserAccountMapper { //使用接口上@Routing注解指定的ds2数据源 UserAccount selectById(@Param("id") int id);  //使用方法上@Routing注解指定的ds1数据源 //注意：这是一个错误的示例，因为user_account表位于db2中 @Routing("ds1") int insert(UserAccount userAccount);}

4.4 包(package)级别的数据源映射

如果项目的目录结构划分的比较好，操作不同的库的Mapper接口，位于不同的package下，如：

剖析Spring多数据源

上图中，db1包下都是操作db1的映射器接口db2包下都是操作db2的映射器接口。此时你可以修改前面的RoutingDataSource配置，通过添加如下配置，直接定义某个package下的映射器，都访问某个库，从而无需在每个接口上都定义@Routing注解。

<bean id="routingDataSource" class="io.github.tianshouzhi.routing.RoutingDataSource">    ... <property name="packageDataSourceKeyMap"> <map> <entry key="io.github.tianshouzhi.routing.mapper.db1" value="ds1"/> <entry key="io.github.tianshouzhi.routing.mapper.db2" value="ds2"/> </map>    </property></bean>

注：对于@Routing注解优先级，优先级满足以下条件：方法>接口>包

4.5 service层调用

Mapper映射器接口属于dao层，通常dao层的代码都是在service层进行调用的，业务层的接口也可以添加@Routing注解，如果没有添加。则由调用的Mapper映射器方法、接口上的@Routing注解决定使用哪个ds，如果都没有没有定义，则使用默认的数据源

public void business(int userId,int userAccountId) {      userAccountMapper.selectById(userAccountId);      userMapper.selectById(userId); }

4.6 service层添加@Routing注解

业务层方法添加@Routing注解后，将忽略内部调用的Mapper映射器方法、接口上的Routing注解，内部调用的所有mapper映射器都会以业务层@Routing注解为准，这是为了与事务的语义兼容(见事务整合分析)。如：

//指定方法内部调用的映射器接口，都必须使用ds2 @Routing("ds2") public void business(int userId,int userAccountId) {     //user_account表位于db2中，因此访问可以成功     userAccountMapper.selectById(userAccountId);     //注意：user表位于db1中，这里强制使用ds2，因此将执行失败     userMapper.selectById(userId);}

4.7 @Routing注解的事务支持

@Routing注解可以与spring的事务联合使用，注意要保证事务中的方法必须都访问的是同一个库中的表。

4.7.1 事务管理器配置

Spring的事务管理器，通过PlatformTransactionManager接口表示，其有2个重要的实现类：

DataSourceTransactionManager：用于支持本地事务，事实上，其内部也是通过操作java.sql.Connection来开启、提交和回滚事务。

http://www.tianshouzhi.com/api/tutorials/distributed_transaction/386

显然，在这里，我们配置的是DataSourceTransactionManager，意味着这里的多数据源不支持分布式事务。

由于RoutingDataSource管理了多个数据源，因此事务管理引用的应该也是RoutingDataSource，以下是声明式事务@Transactional注解的案例：

<bean id="transactionManager" class="org.springframework.jdbc.datasource.DataSourceTransactionManager">    <property name="dataSource" ref="routingDataSource"/></bean><tx:annotation-driven />

这里有必要介绍一下，为什么DataSourceTransactionManager不支持分布式事务。熟悉JDBC编程的同学应该知道，我们可以通过以下方式开开启或者提交一个事务

DataSource ds=...Connection conn=ds.getConnection();//开启事务conn.setAutoCommit(false);
....CRUD操作
//提交s会务conn.commit();

可以看到，事务管理实际上是与Connection绑定的，而Connection又是从某个DataSource中获得的。一个DataSource只能操作一个库，由于我们在配置spring事务管理器DataSourceTransactionManager时，指定了某个DataSource，显然意味着其只能对某个库进行事务操作。

尽管我们这里配置的数据源是笔者提供的RoutingDataSource，其内部管理了多个其他数据源，但是依然不能支持分布式事务，因为RoutingDataSource在运行时，根据配置选择其管理的某一个特定的数据源，交给spring事务管理器来使用。

另外，一点需要注意的是，在事务中无法切换数据源。spring的@Transactional注解，无非一个切入点，spring会对添加了@Transactional注解方法的类进行代理。在这个方法执行之前，就从数据源中获取Connection，开启事务；在方法执行之后，根据是否没有抛出异常，提交或者回滚事务。这里其实隐含了一个很重要的知识点，对于添加了@Transactional注解的方法，在方法执行之前，Spring已经通过DataSource获取到Connection，并开启了事务，在整个事务方法执行结束前，一直都是使用这个Connection，无法进行切换。spring开启事务的源码，可以参考DataSourceTransactionManager.doBegin方法：

剖析Spring多数据源

可以看到，DataSourceTransactionManager实际上，也是通过我们提供的数据源，获取到Connection，通过setAutoCommit(false)来开启事务，与我们熟悉的JDBC编程没有什么区别。

而在Spring开启事务后，底层的ORM框架在访问数据库时，会从spring线程上下文中获取开启事务Connection，也就是说，事务中所有数据库操作，使用的都是同一个Connection。以mybatis为例，其通过mybatis-spring模块与spring整合，mybatis-spring中有一个SpringManagedTransaction类，在创建一个Connection操作数据库，其会通过spring-jdbc模块提供的DataSourceUtils工具类，来获取Connection，如下：

剖析Spring多数据源

DataSourceUtils.getConnection方法内部会先尝试从spring提供的线程上下文中获得Connection，如果spring开启了事务，这个Connection必然存在。接着，mybatis会使用这个Connection创建Statement或者PreparedStatement，来完成增删改查操作。

通过上述代码分析，读者应该知道了，为什么在事务中，不能切换数据源。因为spring开启事务后，使用的Connection就已经确定了，整个事务中都会使用同一个Connection。而一个Connection，必然只能属于一个DataSource。

对于笔者提供的多数据源RoutingDataSource来说，其要完成的功能就是，在spring开启事务之前，就告诉应该使用哪个数据源，这个依然是通过@Routing注解来完成的。

4.7.2 只使用@Transactional注解

只使用@Transactional注解，方法内部的操作，都只能访问默认数据源。会忽略内部调用的其他方法的@Routing注解。如果访问了其他库中的表，将会报错。

@Transactionalpublic void testDefaultTransaction(User user，UserAccount userAcccount) {   //默认数据源是ds1，可以访问db1中user表，因此插入成功   userMapper.insert(user);   //注意：这个方法将执行失败，事务将回滚，因为user_account位于db2中   userAccountMapper.insert(userAcccount)}

4.7.3 同时使用@Transactional/@Routing

spring事务管理器将会使用@Routing注解中指定的数据源来开启事务

@Transactional@Routing("ds2”) //使用ds2开启事务public void testRoutingTransaction(User user，UserAccount userAcccount) { userAccountMapper.insert(userAccount); //注意：这个方法将执行失败，事务将回滚，因为user位于db1中 userMapper.insert(user);}

6 总结

虽然笔者提供了一个RoutingDataSource，并发布到了maven中央仓库，但是并没有期望真的会有人使用。想告诉读者的是，"知其然，知其所以然"。如果你对多数据源的实现细节比较感兴趣，可以通过git 克隆项目源码进行研究：

git clone https://github.com/tianshouzhi/routing-datasource.git

研究源码时，请主要思考以下问题：

1、笔者提供了一个@Routing注解，但是并没有spring aop配置，就实现了AOP切换功能，是如何实现的。因为@Routing本身也要对类代理，才能告诉spring框架使用哪个数据源。

2、@Routing注解和spring提供的@Transactional注解，都需要对类进行代理，且前者需要在后者之前发挥作用。是使用二次代理？还是其他更优雅的方式？

近期发表：

以上是关于剖析Spring多数据源的主要内容，如果未能解决你的问题，请参考以下文章

一步步剖析spring bean生命周期

Spring Mvc源码剖析

HDFS读写机制剖析