运维变更难点分析和应对方式

Posted 姜伯洋

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了运维变更难点分析和应对方式相关的知识,希望对你有一定的参考价值。

什么是变更?

SRE对软件运行环境负责,这个过程中包括大量的资源的部署与配置,这些变更通常对应一定的风险
开发对代码质量和功能负责,这个过程中存在无数次的迭代,每一次的迭代都有能产生一定的未知风

需要解决什么问题:

  • 我们需要一个能够清晰查看到当前已经发生的所有生产级变更事件,以便故障发生时,第一时间查看
  • 需要对核心配置变更梳理一个可落地的流程,将重大变更尽可能的规范化、自动化,拒绝人工操作
  • 需要对变更增加审核确认操作,一是允许此次变更的自动执行,二是变更事件触达团队成员

    解决方案有哪些?

  • 主动上报变更?:由变更人主动发起,提交变更相关表单信息

    缺点:半自动化,需要人为主动提交
  • 实现变更管理系统?:由变更管理系统做变更动作收拢,可以理解为所有的操作,将通过一个平台来进行

    缺点:技术实现难度高,需要实现发布、修改配置等所有高危操作逻辑
  • 主动推动变更?:由各系统打点至统一存储

    缺点:侵入性高,各个系统需要植入打点逻辑

    我们如何选择的?

以上是关于运维变更难点分析和应对方式的主要内容,如果未能解决你的问题,请参考以下文章

页面曝光难点分析及应对方案

敏捷开发中如何从容应对需求变更?

银行分布式数据库设计与运维中的典型难点 | 最佳实践

基于自动化运维工具SaltStackAnsiblePuppet等运维中的难点解析

dW 编辑推荐:自动化运维工具 SaltStack 在云计算环境中的实践

银行云管平台有哪些架构设计难点和运维要点?