物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?

Posted 数列科技公司

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?相关的知识,希望对你有一定的参考价值。


2019年3月11日,申通快递正式宣布阿里巴巴投资46.6亿元,成为公司第二大股东。这也宣告着,申通快递正式加入“菜鸟联盟”。这次入股带来的除了资金以外,也带来了申通快递“智慧物流”的加速建设。


申通快递正式开始全面推进数字化建设,而提升系统性能稳定性正是重中之重。2019年7月底,为备战新一轮双十一,申通指派全链路压测核心技术负责人董工与数列架构师隆冬强接触,商讨基于生产环境的全链路压测方案可行性。


物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?

董工提问 | 隆冬强回答

物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题? 董工

我们物流行业的业务特性决定了系统链路非常复杂且冗长,从系统订单生成、波次计算、拦截拣货、安全验视、批次出库、地区分派需要经过非常多的环节和应用。


如果要进行全链路压测,是不是需要对全链路进行改造?这里面需要我们业务团队怎么配合,会不会耗费非常多的时间?我们的时间可不充裕。


物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?
隆冬强 物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?
这个问题不用担心,目前我们使用了Agent植入技术,对市面上主流的中间件都做了兼容支持,所以我们全链路压测解决方案是不需要对系统进行代码改造的,业务团队只需要将Agent协助部署到应用系统中,就可以完成全链路的梳理和接入了,这是一个非常简单便捷的过程,不会花费太多时间的。



















物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题? 董工
那如果接入像你说的这么简单,又是在生产环境,我很担心数据的安全性啊,压测数据污染了正式数据怎么办,那可都是我们真实的业务数据,出现问题是会造成真金白银的损失的。这块你们又如何保障呢?

隆冬强 物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?
这就不得不说我们产品的亮点功能了,请听我细细道来...




1


流量染色


拿波次计算和拣货任务来说,首先在压测的时候,我们会给所有的压测流量进行染色,让中间件能够区分出哪些是正常订单哪些是压测订单。


物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?


当正常订单经过波次计算,生成拣货任务时,如果Agent识别此流量为正式流量,那该流量将会走正常业务处理,最终被写入正常业务表里。当压测订单经过波次计算,生成拣货任务时,Agent会识别压测流量并对压测流量进行特定逻辑处理,将产生的压测拣货数据存储到影子库表里,从而实现了与正常的业务数据的物理隔离。


2


白名单核验机制


白名单是指进行压测链路改造后的链路集合,通过白名单机制能够有效避免压测流量流经未压测改造的链路造成数据污染


3


压测试跑


每次正式压测前我们会先在性能环境进行压测试跑,试跑成功后才会到线上环境进行小流量试跑,小流量试跑也没问题后才会进行正式的压测。


物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题? 董工
数据隔离的原理我听明白了,但是你们这套Agent一直在我们的系统里运行,怕是要占用不少机器资源吧,会不会给我们的性能带来了额外的损耗呢?

隆冬强 物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?

你说的没错,业务应用植入Agent确实会占用一定的资源,这是不可避免的。据我们评估,整套Agent植入后大约会占用机器3%~5%的性能资源。

虽然不是很多,但考虑到确实很多客户都有这类担忧,我们的产品特地设计了开关控制,可以全局控制压测是否需要启动。你们可以根据实际压测的计划,在不需要压测的时候关闭压测,这样就可以实现几乎0性能损耗了。




为了备战双十一物流顶峰压力,申通全链路压测小组与数列压测实施成员合并成立专项项目组,负责对申通核心系统主要链路的全面生产环境压测,于10月底成功完成所有压测任务,保障了双十一核心系统稳定运行。


想要获取内部【行业解决方案】的同学,联系下面小树微信:

物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?


申明:本文章版权为数列科技所有,未经授权不得以任何形式转载


下一章将讲解与「德邦快递的那些事儿」,敬请期待~

-数列合作伙伴-

物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?


物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?




-图片来自网络-

————————      E   N   D      ————————

以上是关于物流行业案例 | 全链路压测如何保障申通物流系统稳定性问题?的主要内容,如果未能解决你的问题,请参考以下文章

京东刘海锋:Chaos Monkey全链路压测和容器技术 智解双11技术难题

二十问全链路压测干货汇总(上)全网最全

中国人寿业务稳定性保障:“1+1+N” 落地生产全链路压测

全链路压测:系统整体容量保障的“核武器”

全链路压测体系建设方案的思考与实践

系统稳定性保障核武器——全链路压测