阿里再开源!基于JAVA的模块化开发框架JarsLink

Posted 阿里技术

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了阿里再开源!基于JAVA的模块化开发框架JarsLink相关的知识,希望对你有一定的参考价值。

阿里妹导读:JarsLink是一个基于JAVA的模块化开发框架,它提供在运行时动态加载模块(JAR包)、卸载模块和模块间调用的API,它能够帮助你进行模块化开发,也能帮助你的系统在运行时动态添加新功能,减少编译、打包和部署带来的发布耗时,同时它也是阿里巴巴的开源项目之一,目前在蚂蚁金服微贷事业群各团队广泛使用。



需求背景


  • 应用拆分的多或少都有问题。多则维护成本高,每次发布一堆应用。少则拆分成本高,无用功能很难下线。

  • 故障不隔离。当一个系统由多人同时参与开发时,修改A功能,可能会影响B功能,引发故障。

  • 多分支开发引发冲突。多分支开发完之后合并会产生冲突。

  • 牵一发动全身。一处核心代码的改动,或一个基础Jar的升级需要回归整个系统。

  • 升级和迁移成本高。中间件升级每个应用都有升级成本。


模块化开发的好处

阿里再开源!基于JAVA的模块化开发框架JarsLink


  • 可插拔,一个应用由多个模块组成,应用里的模块可拆和合,模块可快速在多个系统中迁移和部署。

  • 模块化开发,模块之间互相隔离,实现故障隔离。

  • 一个模块一个分支,不会引发代码冲突。

  • 在模块中增加或修改功能,只会影响当前模块,不会影响整个应用。

  • 动态部署,在运行时把模块部署到应用中,快速修复故障,提高发布效率。

  • 多版本部署,可以在运行时同时部署某个模块的新旧版本,进行AB TEST。

  • 减少资源消耗,通过部署模块的方式减少应用数量和机器数量。


JarsLink的应用场景


  • 数据管理中心,如果你需要开发一个数据管理系统,这个系统需要去不同的异构系统采集数据,这些系统会提供不同类型的接口,如RPC,HTTP等。并且数据采集的数据源多,每种数据源都需要对接和开发,数据质量比较差,需要经常修改代码进行发布。在这种场景下,通过模块化开发,实现一个数据源使用一个模块进行对接,上线新数据源只需要新增模块,修改BUG只需要修改某个模块,并能快速上线。

  • 后台管理系统,互联网应用发展到一定阶段会出现很多后台需求,如客服查询用户的信息帮助解答问题,开发查后台数据排查系统BUG,运营使用后台功能发送运营活动等。这些功能发布频率会大于核心系统,如果放在核心系统里会影响其稳定性,所以我们必须要建一个后台系统来开发后台功能,但是这样又带来一个新的问题,很多开发都会来这个系统进行开发,拉多分支造成代码冲突,A业务的BUG影响到B业务。所以如果每个业务线一个模块,每个模块使用一个单独的分支进行开发,就能进行隔离开发,提高开发速度,开发完后在运行时加载到系统中。

  • 微服务集成测试, 目前一个微服务是一个FAT JAR,如果有几十个微服务,则需要启动很多进程,DEBUG端口会很多,使用JarsLink框架合并FAT JAR,再路由请求到其他JAR,就可以只启动一个进程进行DEBUG测试。

  • 指标计算系统,可以把消息转发到不同的模块中进行处理,并输出指标。


目前蚂蚁金服微贷事业部几个系统和几十个模块已经使用JarsLink框架。


JarsLink的特性


隔离性


  • 类隔离:框架为每个模块的Class使用单独的ClassLoader来加载,每个模块可以依赖同一种框架的不同的版本。

  • 实例隔离:框架为每个模块创建了一个独立的Spring上下文,来加载模块中的BEAN,实例化失败不会影响其他模块。

  • 资源隔离:后续会支持模块之间的资源隔离,每个模块使用独立的CPU和内存资源。


动态性


  • 动态发布:模块能在运行时动态加载到系统中,实现不需要重启和发布系统新增功能。支持突破双亲委派机制,在运行时加载父加载器已经加载过的类,实现模块升级依赖包不需要系统发布。

  • 动态卸载:模块能在运行时被动态卸载干净,实现快速下线不需要功能。


易用性


提供了通用灵活的API让系统和模块进行交互。


实现原理


模块加载


JarsLink为每个模块创建一个新的URLClassLoader来加载模块。并且支持突破双亲委派,设置了overridePackages的包将由子类加载进行加载,不优先使用父类加载器已加载的。


模块的卸载


卸载模块需要满足三个条件:

  • 模块里的实例对象没有被引用

  • 模块里的Class没有被引用

  • 类加载器没有被引用


所以需要做到三点卸载实例,卸载类和卸载类加载器,整个模块的卸载顺序如下:


阿里再开源!基于JAVA的模块化开发框架JarsLink


  •  关闭资源:关闭HTTP连接池或线程池。

  • 关闭IOC容器:调用applicationContext.close()方法关闭IOC容器。

  • 移除类加载器:去掉模块的引用。

  • 卸载JVM租户(开发中):卸载该模块使用的JVM租户,释放资源。


模块间隔离


模块化开发需要解决隔离性问题,否则各模块之间会互相影响。模块之间的隔离有三个层次:


  • 类隔离:为每个模块创建一个类加载器来实现类隔离。

  • 实例隔离:为每个模块创建一个新的IOC容器来加载模块里面的BEAN。

  • 资源隔离:对每个模块只能使用指定的CPU和内存。


目前JarsLink实现了类隔离和实例隔离,资源隔离准备引入ALIJVM多租户来解决。


阿里再开源!基于JAVA的模块化开发框架JarsLink


模块间通讯


模块之间的通讯也有三种方式,RPC,本地调用,深克隆/反射。


阿里再开源!基于JAVA的模块化开发框架JarsLink


  • 本地调用:目前JarsLink的doAction就是使用的这种通讯方式,这种方式要求模块的类加载器是父子关系,且IOC容器也是父子容器。

  • RPC调用:用于跨JVM的模块之间调用,利用SOFA 4动态API在模块中发布和引用TR服务来实现。

  • 深克隆/反射:深克隆其他模块的入参,反射其他模块的方法实现调用。


类加载机制


OSGI类加载机制的关系采用的是网状结构,每个模块通过 Export-Package 来声明我要给别人用哪些类,通过 Import-Package来声明我要用别人的哪些类。JarsLink采用扁平化管理,每个模块都有一个共同的父类,这个父类加载器就是加载ModuleLoader类的加载器,如果是SOFA应用,模块的父加载器是KernelAceClassLoader,类加载器关系如下:

阿里再开源!基于JAVA的模块化开发框架JarsLink


如果所有模块都需要使用的类,可以通过KernelAceClassLoader加载,如果是SOFA系统可以通过POM引入。


JarsLink框架类图


JarsLink框架的类图如下:

阿里再开源!基于JAVA的模块化开发框架JarsLink


  • AbstractModuleRefreshScheduler:入口类,负责定期扫描本地和内存中的模块是否发生变更,如果变更,则更新模块。

  • ModuleLoader:模块加载引擎,负责模块加载。

  • ModuleManager:模块管理者,负责在运行时注册,卸载,查找模块和执行Action。

  • Module:模块,一个模块有多个Action。

  • Action:模块里的执行者。


如何使用?


1:引入POM

JarsLink Maven Repo

阿里再开源!基于JAVA的模块化开发框架JarsLink

JarsLink依赖的POM也需要引入

阿里再开源!基于JAVA的模块化开发框架JarsLink


2:引入jarslink BEAN


在系统中引入以下两个BEAN。

阿里再开源!基于JAVA的模块化开发框架JarsLink

3:集成JarsLink API


使用JarsLink API非常简单,只需要继承AbstractModuleRefreshScheduler,并提供模块的配置信息,代码如下:

阿里再开源!基于JAVA的模块化开发框架JarsLink

这个调度器在bean初始化的时候会启动一个调度任务,每分钟刷新一次模块,如果模块的版本号发生变更则会更新模块。实现这个方法时,必须把模块(jar包)下载到机器本地,模块的配置信息说明如下:


  • name:全局唯一,建议使用英文,忽略大小写。

  • enabled:当前模块是否可用,默认可用,卸载模块时可以设置成false。

  • version:模块的版本,如果版本号和之前加载的不一致,框架则会重新加载模块。

  • Properties:spring属性配置文件。

  • overridePackages:需要突破双亲委派的包名,一般不推荐使用,范围越小越好,如com.alipay.XX。


把ModuleRefreshSchedulerImpl类注册成Spring的bean。


阿里再开源!基于JAVA的模块化开发框架JarsLink


JarsLink API 暂时不提供模块可视化管理能力,所以需要使用其他系统来管理和发布模块。目前可以通过com.alipay. jarslink.api.ModuleManager#getModules获取运行时所有模块的信息。


你也可以使用API来加载并注册模块,详细使用方式可以参考ModuleManagerTest,代码如下。

阿里再开源!基于JAVA的模块化开发框架JarsLink


3:开发模块


在模块中只需要实现并开发Action,代码如下:

阿里再开源!基于JAVA的模块化开发框架JarsLink


5:调用接口


开发者需要利用JarsLink API把请求转发给模块,先根据模块名查找模块,再根据aciton name查找Action,最后执行Action。

阿里再开源!基于JAVA的模块化开发框架JarsLink

其他特性


Spring配置


通过moduleConfig的Properties属性可以设置Spring bean变量的配置信息。

阿里再开源!基于JAVA的模块化开发框架JarsLink


最佳实践


HTTP请求转发


可以把HTTP请求转发给模块处理。

阿里再开源!基于JAVA的模块化开发框架JarsLink


消息请求转发


可以把消息转发给模块进行处理。遵循默认大于配置的方式,你可以把TOPIC当做模块名,EventCode当做ActionName来转发请求。


接口说明


JarsLink框架最重要的两个接口是ModuleManager和ModuleLoader。


ModuleManager接口


ModuleManager负责注册,卸载,查找模块和执行Action。

阿里再开源!基于JAVA的模块化开发框架JarsLink

ModuleLoader接口


ModuleLoader只负责加载模块。


阿里再开源!基于JAVA的模块化开发框架JarsLink

近期,JarsLink会支持多版本加载,并陆续支持模块间调用、资源隔离等特性。我们也希望更多的童鞋参与进来,让JarsLink帮助更多开发者提升效率。




你可能还喜欢












关注「阿里技术」

把握前沿技术脉搏

以上是关于阿里再开源!基于JAVA的模块化开发框架JarsLink的主要内容,如果未能解决你的问题,请参考以下文章

模块化开发框架JarsLink

开发 | 阿里巴巴开源深度学习框架 X-Deep Learning,引领高维稀疏数据场景的深度学习标准

开源框架 系统

基于laravel 框架的开源cms推荐

腾讯开源的RPC框架,要干阿里Dubbo?别打了,还不都是基于它构建!

Dubbo分布式框架(阿里开源)