ansible 踩坑总结
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ansible 踩坑总结相关的知识,希望对你有一定的参考价值。
12报错
12.1 libselinux-python aren’t installed
[[email protected] ~]# yum -y install libselinux-python
有时候这个包需要在所管理的机器上安装,要不然就会报错
12.2 failed to resolve remote temporary directory from ansible-tmp
这个问题google了好多,发现这个问题是个通病,会随机的出现如下错误
2.0和2.1的版本都会有这种问题,但是在乌班图系统上可能会好点,网友提供了个方法,比如,加参数,这个貌似在乌班图上有用,但是在centos上不行
[[email protected] ~]# ansible other1024 -i /etc/ansible/hosts -m ping --ssh-extra-args="-o ControlMaster=no -o ControlPath=none -o ControlPersist=no"
但是还是会报如下错误
最后百度了国人的一篇文章,说是升级openssh就可以了
然后自己执行一下命令,问题解决了
yum -y install openssh*
12.3 Authentication or permission failure
老是报下边的这个错误,我记得以前是通的了,怎么现在不通了
后来查看磁盘空间的时候,发现磁盘空间满了,将所在安装目录空间清空以后,就可以了
12.4 Cannot retrieve repository metadata
[[email protected] yml]# yum --disablerepo=epel -y update ca-certificates //需要更新ca证书
12.5 Failed to connect to the host via ssh.
176.27.1.205 | UNREACHABLE! => {
"changed": false,
"msg": "Failed to connect to the host via ssh.",
"unreachable": true
}
造成这个问题的原因有很多种,而且需要提供更为详细的信息,这个报错是无法判断错误出在哪里的。
遇到这个问题很困惑,查了很多资料都无法解决,网友说可以升级ansible试试,所以我就使用yum升级了下ansible
[[email protected] ~]# ansible 176.27.1.205 -m command -a "date"
然后执行命令的时候,仍然失败,但是相比之前的报错,这次ansible给出了很明确的报错信息,如下
176.27.1.205 | UNREACHABLE! => {
"changed": false,
"msg": "Failed to connect to the host via ssh: ssh: connect to host 176.27.1.205 port 22: Connection refused
",
"unreachable": true
}
于是检查配置文件信息,确实端口不对,重新设置端口后成功
[[email protected] ~]# ansible 176.27.1.205 -m command -a "date"
176.27.1.205 | SUCCESS | rc=0 >>
2017年 01月 16日 星期一 15:07:50 CST
12.6关键字写错
如果yml文件有语法错误,这个是关键字hosts写成了host,那么则不会执行,如下
12.7后边没有空格
这是因为:后边没有空开一行,所以报错
12.8磁盘空间已满
会提示如下报错
172.168.0.6 | FAILED! => {
"changed": false,
"checksum": "ad052d5c834bb9fa98202f3836f1bf9e4fcc958a",
"failed": true,
"module_stderr": "Shared connection to 172.168.0.6 closed.
",
"module_stdout": "Traceback (most recent call last):
File "/tmp/ansible_e3s2ku/ansible_module_copy.py", line 364, in <module>
main()
File "/tmp/ansible_e3s2ku/ansible_module_copy.py", line 343, in main
module.atomic_move(b_mysrc, dest, unsafe_writes=module.params[‘unsafe_writes‘])
File "/tmp/ansible_e3s2ku/ansible_modlib.zip/ansible/module_utils/basic.py", line 2003, in atomic_move
NameError: global name ‘exception‘ is not defined
",
"msg": "MODULE FAILURE"
12.9 filebeat服务起来了,但是端口没起来
京区十几台服务器,但是总有那么几个中心filebeat服务起来了,但是端口就是没有起来。重启了无数遍,看了配置文件,感觉没什么改的。后来,看收集的日志,原来是日志没有进行读写,因为tmooc受到***,所以关了服务器。没有访问日志,所有就没有起端口进行连接,只要有日志写进去,就会起端口连接
12.10报错
执行task有错误,导致下边的也无法执行,增加忽略错误即可
ignore_errors: True
12.11 shell报错
在本地执行的命令取出来东西后,放到playbook中怎么都取不出来,发现确实还需要调整,不能本地执行成功的直接放到脚本里,下边这个就是在本地$3,在脚本就得取$4
shell: /bin/stat ‘{{remote_go_dir}}‘/{{project}}/{{appname}}| head -1| awk ‘{print $4}‘|sed ‘s/^.//‘|sed ‘s/.$//‘
12.12 变量问题
使用vars定义了变量 Env,然后在执行过程中,老不能取出来这个值,但是其它的变量没有问题,然后使用了其它的变量就可以了
12.13 输出打印问题
老输出的是那种一坨,不是我想要的分开的那种,有人说用strdout_lines可以,但是我这边并不行
以上是关于ansible 踩坑总结的主要内容,如果未能解决你的问题,请参考以下文章