zabbix触发条件动作执行脚本案例
Posted make有意义
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了zabbix触发条件动作执行脚本案例相关的知识,希望对你有一定的参考价值。
这里以zookeeper+kafka服务发生故障处理过程为案例,结合zabbix自动化处理远程脚本重启服务并备份日志,事后查看分析具体原因。
问题点:zookeeper+kafka,应用程序,会发现集群中的其中一个会不起作用,我这里主要是kafka-broker:0(即kafka主导者-leader)不起作用,导致进来的数据进不到后端应用服务处理。
经发现:会发现,有时不能单对zk+kafka作程序存不存在的判断,以上问题主要是程序还存在,却不起作用的问题。整个过程,cpu,内存,负荷等都还是与其它时段没存在太大的差异性,唯一的明显差异性在于其一网口out流量会突降,可根据此作为条件判断触发。
(这里暂不分析具体的产生原因,因为可能会是zk-kafka集群间的问题,也有可能是存在程序服务死锁,或开发程序逻辑产生的原因。。。)
此需结合前面zookeeper+kafka几篇的解说,这里只分析zabbix触发条件动作执行脚本。
1.zabbix执行远程脚本开放相应权限:
#zabbix_agentd.conf
EnableRemoteCommands = 1
#/etc/sudoers
zabbix ALL=NOPASSWD: ALL
zabbix ALL=NOPASSWD: /bin/bash /data/monitor/script/xxx.sh
#Defaults requiretty 注释
2.在zabbix添加相应动作(因为zabbix要 以其它用户执行脚本,会比较麻烦,我这里是先以root权限执行一个脚本 ,再以该脚本触发另一以其它用户执行的脚本)
#sudo 以root权限执行脚本。如没,默认会以zabbix用户执行。
以上是关于zabbix触发条件动作执行脚本案例的主要内容,如果未能解决你的问题,请参考以下文章