自动化工具后起之秀Ansible的部署实践
Posted EAWorld
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了自动化工具后起之秀Ansible的部署实践相关的知识,希望对你有一定的参考价值。
从早期手动加脚本的部署方式,到后来自动化工具(chef, puppet, saltstack, ansible等)的出现,再到如今DevOps的盛行,企业应用部署正式进入平台部署阶段,CD(持续部署)已经成为企业对应用部署的标准需求,运维的交付也不再是以周或天为单位,而是以分钟为单位。
本文主要介绍自动化工具Ansible,及其在普元DevOps平台中的应用部署和日常应用部署中的实践。
本文目录:
一、如何选择合适的自动化工具?
二、Ansible架构图及工作流程
三、DevOps基于Jenkins+Ansible+GitLab的部署实践
四、Ansible日常应用部署实践
五、总结
一、如何选择合适的自动化工具?
面对众多的自动化工具(chef, puppet, saltstack, ansible等),我们该如何选择适合自己的呢?总的来说,无外乎从以下几点来权衡利弊。
活跃度(GitHub活跃度,社区活跃度)
学习成本
使用成本
编码语言
性能
各种开源的自动化工具在GitHub的关注度是其活跃度最直观的体现,从图中Contributors这一项就可以看出Ansible和SaltStack的开源项目贡献者远远多于其它几种自动化工具。越活跃的开源项目往往意味着更完善的功能和更高效的问题解决率。
Ansible Galaxy和Salt Formulas都提供了丰富的第三方工具,基本覆盖了日常部署应用的所有需求。
Puppet和Chef使用的开发语言是Ruby,而Saltstack和Ansible使用的开发语言则是在运维开发这个圈子相对吃得开的Pythen,这也是SaltStack和Ansible相对于Puppet和Chef更容易被接收的原因。
很多选择Ansible的朋友,大多都是觉得Ansible上手简单,因为Ansible默认采用SSH连接的方式,不需要安装配置Client,只需要在Server端配置SSH连接信息即可。这也是Ansible相对其他自动化工具的一大优势,但是这一优势带来的影响就是实现机制的差异导致在大规模环境下,Ansible的性能确实要比SaltStack差很多,当然,规模大概在一两百台机器左右Ansible的性能也是可以接受的。如果是做少量机器应用部署的话,性能问题也就不是那么关键了。
综合以上因素,最后我们选择Ansible作为我们DevOps部署功能底层实现的自动化工具。
二、Ansible架构图及工作流程
先来看看这张架构图(来源于网络),看起来是不是很简单,首先对Ansible架构图的各个组成部分作一个说明。
核心引擎:即图中所看到的Ansible。
核心模块(Core Module):和大多数运维工具一样,将系统和应用提供的能力模块化,一个模块有点像编程中一个功能接口,要使用的时候调用接口并传参就可以了。比如Ansible的service模块,你要保证名为nginx的service处于启动状态,只需要调用service模块,并配置参数name: nginx,state: started即可。
自定义模块(Custom Modules):显而易见,如果Ansible的核心模块满足不了你的需求,你可以添加自定义化的模块。
插件(Plugins):模块功能的补充,如循环插件、变量插件、过滤插件等,也和模块一样支持自定义,这个功能不常用(我没用到过),就不做细说了。
剧本(playbooks):说到这个,先说说Ansible完成任务的两种方式,一种是Ad-Hoc,就是ansible命令,另一种就是Ansible-playbook,也就是ansible-playbook命令。他们的区别就像是Command命令行和Shell Scripts。
连接插件(connectior plugins):Ansible默认是基于SSH连接到目标机器上执行操作的。但是同样的Ansible支持不同的连接方法,要是这样的话就需要连接插件来帮助我们完成连接了。
Ansible工作流程大致就是这个样子,之后在日常应用部署实践部分对一个应用部署的调用流程再做说明。
三、DevOps基于
Jenkins+Ansible+GitLab的部署实践
既然已经决定用Ansible来完成应用部署的底层实现,那我们如何将Ansible和DevOps结合起来呢?
首先想到的是API,Ansible倒是有一套Python的API接口,但想来在DevOps中做Ansible Python接口的集成封装不太容易,再就是Ansible通过命令行提供服务,并没有启动进程及监听端口,没想通如何在DevOps中调用Ansible接口,自己对Python亦不是太熟,因此便放弃了这种方式。
之后便了解到了Ansible Tower,Ansible Tower是Ansible的web界面,采用REST API作为接口,先安装起来看看效果。
上图为首页及任务执行页面截图,从它相对简洁的页面我们就能看出它提供的大部分功能。
首页推送最近使用的Job和最近Job执行情况。
主机管理。
实时的playbooks输出和浏览。
执行历史数据预览及报表。
基于角色的访问控制。
REST API。
任务页面截图是一个安装部署Nexus的Task,在它的历史任务执行页面可以清晰的看到任务执行的实时输出,任务执行的变量信息,以及任务每一步的耗时情况等。
Ansible Tower看起来还是挺不错的,不仅提供了主机管理,任务管理,任务历史及实时输出等能力,还提供了直观实用的报表。奈何,因为它收费的原因,还是被PASS掉了。
正苦思冥想之际,有幸得见一篇文章《Jenkins+Ansible+Gitlab自动化部署三剑客》,文中提到的这种使用方式与我们DevOps本身的很多设计点不谋而合。
在CI(持续集成)的设计上,我们本身也是将Jenkins作为集成工具来使用的,同时Jenkins2版本的Pipeline as Code也给CD(持续部署)带来了无限的可能。当然,也增加了一定的学习成本,那就是Pipeline的核心Groovy,一种基于JVM(Java虚拟机)的敏捷开发语言。
Jenkins给我映像较深的一点就是它强大的扩展性,它同样支持Ansible的扩展插件Ansible plugin,在Pipeline中使用插件和其他类型的Job略有不同,创建一个Pipeline Job之后,可以使用Pipeline Syntax配置插件和参数,然后Jenkins会自动生成可以在Pipeline中使用的代码片段。
再来说GitLab,当然,也可以是其他Jenkins支持的代码版本控制系统。它在整个过程中担任什么样的角色呢?试想,我们所需要管理的部署机器和产品对应着的部署脚本,如果单单只是保存在某个Server端,如何进行编写维护以及更新,如何形成运维日积月累过程中的经验与知识产物。
这里GitLab可以很好的帮助我们进行Playbooks的管理,我们只需要将Playbooks提交到仓库,然后在通过Jenkins执行部署之前,将Playbooks拉取到Job的workspace中,然后调用执行就可以了。
如何将DevOps与这种Jenkins+Ansible+GitLab的实现方式结合起来呢?
我们DevOps部署大致操作流程如下:
资源:创建部署需要的环境信息,可以是物理机,虚拟机以及容器云环境。
设计:设计部署容器,比如部署mysql和tomcat并设置tomcat依赖mysql的关系。然后提交设计。
转换:配置部署策略以及部署模式,设置部署容器的参数,创建部署计划并执行部署。
运维:部署容器运维,启停、卸载、伸缩、回滚等操作。
实现方式大致可以简化为:根据模板化的表设计动态生成部署配置页面,页面参数传递结合静态的部署模板(groovy)生成Jenkins的config.xml文件,然后调用Jenkins的API接口创建Jenkins的部署Job。
那我们要进行一个部署容器的扩展,我们需要做哪些工作呢?
1.在模板化的表设计中新添加部署容器(如mysql)的相关信息(组件依赖,属性定义字段等)。
2.按照既定的规则在脚本目录添加groovy模板(安装,卸载,运维等)。
3.在脚本库中添加groovy模板中对应调用的ansible playbooks。
四、Ansible日常应用部署实践
因为DevOps应用及其集成的第三方工具也需要自动化部署,刚好又接触了Ansible这样一款自动化工具,所以就写了一套快速部署DevOps应用及一些第三方工具的playbooks。
单看这张图,大家可能觉得有点不明所以,我们结合DevOps平台部署的playbooks目录结构及文件类容对此部署设计做一个说明。
Ansible机器分组:就是Ansible的host inventory文件,内容为机器分组信息及组变量,在DevOps平台部署中担任配置文件的角色,部署前只需要修改此文件即可(修改应用的安装配置和对应每个分组的部署机器)。
DevOps部署角色:对应的site.yml是应用部署的入口文件,这里将DevOps应用分成8个角色,分别是devops、mysql、jenkins、nexus、sonarqube、gitlab、cmdb、jira。每个部署角色对应多个role。
Ansible Role:可以理解为Ansible中可复用的最小的操作单元,这里考虑的不只是DevOps的部署了,考虑到playbooks文件在今后的日常使用中也会使用到,比如要安装一个jenkins,只需要在inventory中添加机器信息,然后定义入口文件使用repo(考虑到无外部网络访问权限情况,配置内网源)和jenkins两个role即可。
执行命令行ansible-playbook –i devops.inventory site.yml即可开始执行部署,首先会根据site.yml入口文件中hosts中配置的信息去devops.inventory中获取主机及主机变量信息,然后根据remote_user配置和ansible.cfg中配置的SSH连接信息去执行连接,然后根据roles配置的角色去执行相应的Task。接下来我们看看Ansible Role的目录结构和内容。
Roles主要依赖于目录及文件的命名和摆放。目录说明如下:
file:copy模块文件默认路径,这里存放安装文件和一些不需要修改的固定文件。
handlers:在发生改变时执行调用的task。如在tasks目录下main.yml中有一步修改配置文件后调用handlers,当执行时该步状态为changed就会调用handlers中的task。
tasks:存放role任务文件的目录,main.yml就是任务入口文件。
templates:template模块文件默认路径,用于存放配置文件和会改变的文件,文件中会定义变量信息,在传递时进行变量的替换。
vars:role的变量目录,可以存放role的变量配置信息,为了方便用户统一配置,这里未使用role变量,而是采用了inventory中的组变量。
以下为在Playbooks中用到的一些技巧
register:注册变量。
场景:在mysql5.6版本安装完成后会生成默认root用户的密码并写进~/.mysql_secret文件,那我们要在安装完成之后用这个root密码执行初始化操作就可以使用这种注册变量的方式。
扩展用法:判断某个文件或文件夹是否存在,来控制task是否执行。当when语句的结果为true时才执行task。
Include:文件加载,在一个任务文件中调用另一个任务文件。
场景:一个常用的任务片段在现今或之后的任务文件中都可能用到,我们可以将它单独抽离编写一个任务文件,然后再其它文件通过include引用即可。
扩展用法:通过定义变量或注册变量的方式,动态控制是否执行一个任务文件。
ignore_errors:是否忽略错误。
场景:执行某一步,即使该步返回错误依然继续其他的任务。常用与command和shell模块。如示例,在安装mysql时先去删除机器可能自带的mariadb-libs,在不存在mariadb-libs包时会报错,忽略此错误。
wait_for: 校验文件或端口的状态。
场景:等待一个端口启动、关闭或一个文件的生成、删除,常见于启动应用后等待应用端口启动,然后执行接下来的任务。
扩展用法:用来校验端口是否启动或文件是否存在。
setup:获取目标机器信息,并注册成主机变量。
template:自定义模板。
场景:大多数情况,我们只需要把配置文件中某些需要变更的变量抽成配置即可,但像nginx这种需要动态配置或相对复杂的配置文件,就可能会用到Jinja2强大的模板自定义的能力了,最后这张图是安装DevOps集群环境是根据group分组中的ip以及组变量中的端口配置动态生成nginx config文件的一个片段。
五、总结
Ansible作为自动化工具中的后起之秀,因其简单易用,无代理架构的特性,已经被广大的自动化运维爱好者和初学者所接受并使用,如果不做二次开发,甚至都不需要对Python有深入的了解,实际上它丰富的模块也已经基本满足日常运维所有的需求。依稀记得第一次接触到Ansible是在部署openshift(基于k8s的容器云平台)的时候,这种复杂应用的部署通过简单的几行配置就完成了,不只是运维,相信对Linux系统有所了解的研发人员也可以通过Ansible完成复杂应用的部署。
关于作者
张子康
普元研发工程师,曾参与神华灾备云平台、万达DevOps平台等项目。对云计算相关技术有浓厚的兴趣,熟悉IaaS,k8s,docker等技术,在DevOps项目中主要负责集成环境的搭建以及部署功能的底层实现。
关于EAWorld
以上是关于自动化工具后起之秀Ansible的部署实践的主要内容,如果未能解决你的问题,请参考以下文章