告警系统邮件引擎, 运行告警系统
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了告警系统邮件引擎, 运行告警系统相关的知识,希望对你有一定的参考价值。
告警系统邮件引擎
- 因为之前做zabbix的时候,做过mail.py的脚本,在这里,直接复制到
mail目录下就行 - 但是告警邮件引擎核心,conf主配置文件调用到的都是mail.sh ,所以这里需要定义调用mail.py的sh脚本
- mail.sh目的是做告警收敛,如果不想做告警收敛,在发现问题的时候直接告警就好,但是,可能会发生1分钟前发现问题,1分钟户问题解决,这样就会变成误报,这样会很麻烦
- 收敛的目的就是1分钟前发现问题,然后到10分钟后,服务还没有恢复,就会告诉管理人员10分钟了服务还未恢复
#!/bin/bahs log=$1 t_s=`date +%s` t_s2=`date -d "2 hours ago" +%s` #定义2个小时前的时间戳 #日志不存在就创建日志 if [ ! -f /tmp/$log ] then echo $t_s2 > /tmp/$log fi #下面这段,等同于一个计时器 t_s2=`tail -1 /tmp/$log|awk ‘{print $1}‘` echo $t_s>>/tmp/$log v=$[$t_s-$t_s2] //时间戳对比 echo $v #当结果大于3600秒,就会进行告警 if [ $v -gt 3600 ] then ./mail.py $1 $2 $3 echo "0" > /tmp/$log.txt //等同于计数器 else #不然就重新计数 if [ ! -f /tmp/$log.txt ] then echo "0" > /tmp/$log.txt fi nu=`cat /tmp/$log.txt` nu2=$[$nu+1] echo $nu2>/tmp/$log.txt if [ $nu2 -gt 10 ] then ./mail.py $1 "trouble continue 10 min $2" "$3" echo "0" > /tmp/$log.txt //邮件告警结束以后,重新开始计数 fi fi
运行告警系统
- 可以每分钟执行一次主脚本来运行告警系统
crontab -e * * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh
- 调试,监控发送邮件的部分,有三个参数(发给谁,邮件名称,内容),参数之间尽量少用空格,因为mail.py发送邮件是以空格来定义三个参数的
以上是关于告警系统邮件引擎, 运行告警系统的主要内容,如果未能解决你的问题,请参考以下文章