运维变更难点分析和应对方式
Posted 姜伯洋
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了运维变更难点分析和应对方式相关的知识,希望对你有一定的参考价值。
什么是变更?
SRE对软件运行环境负责,这个过程中包括大量的资源的部署与配置,这些变更通常对应一定的风险
开发对代码质量和功能负责,这个过程中存在无数次的迭代,每一次的迭代都有能产生一定的未知风
需要解决什么问题:
- 我们需要一个能够清晰查看到当前已经发生的所有生产级变更事件,以便故障发生时,第一时间查看
- 需要对核心配置变更梳理一个可落地的流程,将重大变更尽可能的规范化、自动化,拒绝人工操作
- 需要对变更增加审核确认操作,一是允许此次变更的自动执行,二是变更事件触达团队成员
解决方案有哪些?
- 主动上报变更?:由变更人主动发起,提交变更相关表单信息
缺点:半自动化,需要人为主动提交 - 实现变更管理系统?:由变更管理系统做变更动作收拢,可以理解为所有的操作,将通过一个平台来进行
缺点:技术实现难度高,需要实现发布、修改配置等所有高危操作逻辑 - 主动推动变更?:由各系统打点至统一存储
缺点:侵入性高,各个系统需要植入打点逻辑我们如何选择的?
以上是关于运维变更难点分析和应对方式的主要内容,如果未能解决你的问题,请参考以下文章
基于自动化运维工具SaltStackAnsiblePuppet等运维中的难点解析