技术圈招联自动化运维实践
Posted Tech圈中事
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了技术圈招联自动化运维实践相关的知识,希望对你有一定的参考价值。
招联金融作为行业内领先的金融企业,不断提高自身的安全意识,同时为支撑线上贷款业务,不仅需要应用能快速迭代,还要求公司能处理各种紧急事故的应变能力。2019年,公司业务连续性>99.99%,除了运维人员的努力付出外,强大的运维工具也功不可没。
对于IT行业来说,自动化扩容是运维发展的必经之路,实现快速准确成功率高的自动化扩容对保证业务连续性至关重要。
扩容的流程复杂,包括准备资源、配置网络、搭建应用启动环境、录CMDB、部署和启动应用、加入负载,最后还要为运维和开发人员等配置服务器的用户权限。
因此为保证业务能运行起来,部分公司在自动化扩容这块会牺牲掉一些自动化能力,比如提前准备资源、提前安装好环境,又或者是放弃配置用户权限等,实现半自动化的扩容。
招联的研发人员则迎难而上,克服了所有的困难,实现了一键全流程自动化扩容,自动化程度达100%,扩容从零基础开始,购买服务器、安装系统、配置网络、登记CMDB、配置监控、部署和启动应用、添加负载、配置用户权限,实现全流程自动化。
招联的自动化扩容不仅能在无任何提前准备的条件下完成扩容,而且在扩容完成后自动为新机器配置监控,实时监控服务器运行状况、应用接口调用以及网络使用情况。
灾难往往都是没有预兆的,如812爆炸事件,对于互联网企业来说,无论是天灾还是人祸,一旦发生,就可能影响业务,甚至直接中断,短时间内完全瘫痪。
招联金融作为行业代表,在灾备建设上极其重视,设立灾备能力建设的重大项目,在短短的三个月内就完成了灾备切换能力建设。
同时这种一键完成灾备切换的能力,是在用户无感知的情况下进行,通过灾备技术实现30分钟内核心业务系统整体一键迁移,保障服务的连续性和稳定性。
基于公司的自动化扩容能力,灾备同样能在零基础的情况下完成切换,使得公司具备了能在各种无法预知的灾难发生后,快速恢复核心业务的能力。
而在日常运维中,这种系统切换能力也帮助了运维人员快速完成迁移变更等操作。
招联金融监控体系基于CMDB系统,针对设备类型和监控类型,使用多套工具进行监控。严格遵循安全隔离要求,这些监控采集端在每个机房都部署了一套,实现自动化监控采集、配置,由监控系统一收集数据、展示与告警。基于这套监控体系,运维人员不再需要手工配置,监控配置实现完全自动化。监控体系会智能识别监控对象的类型和所在机房,为其配置该机房对应的数据采集工具,且配置过程对运维人员完全透明,即便业务系统经过多次跨机房的迁移,也不会对监控造成丝毫影响。招联在保证信息安全的同时,又实现了资源全覆盖监控。
招联金融致力于运维工具全自动化,运维工作智能化。
目前运维工具的自动化程度为智能化运维打下了坚实的基础,并将CMDB数据的准确率提高至100%,运维工具消费的同时又维护了CMDB数据,实现有机循环。
监控体系自动监控,无阈值告警,智能分析故障原因,进一步提高了运维能力。
以上是关于技术圈招联自动化运维实践的主要内容,如果未能解决你的问题,请参考以下文章
电子书 Python自动化运维:技术与最佳实践.pdf
运维自动化Saltstack配置管理实践
新浪微博自动化运维平台实践
某银行数据中心自动化运维设计实施及Ansible应用探索 | 最佳实践
线上交流,欢迎来聊 | 企业自动化运维落地的实践经验及运维工具选型对比分析
新华三某大型银行自动化运维规划实践