shell 练习(13) —— 监控 httpd 进程数是否异常
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了shell 练习(13) —— 监控 httpd 进程数是否异常相关的知识,希望对你有一定的参考价值。
1. 题目
在服务器上,写一个监控脚本,要求如下:
1)每隔 10s 去检测一次服务器上的 httpd 进程数,如果大于等于 500 的时候,就需要自动重启一次 apache 服务,并且检测启动是否成功。
2)若没有正常启动还需再一次启动,最大不成功数超过5次则需立即发送邮件通知管理员,并且以后不再检测!
3)如果启动成功后,1分钟后再次检测 httpd 进程数,若正常则重复之前操作(每隔 10s 检测一次),若还是大于等于 500,那放弃重启并需要发送邮件给管理员,然后自动退出该脚本。假设其中发送邮件的脚本是mail.py。
2. 分析
1)每隔 10s 检测一次,用死循环 while 实现;
2)检测 httpd 进程数,用 pgrep -l httpd | wc -l 统计;如果大于等于 500 则重启用 /usr/local/apache2/bin/apachectl restart 。
3)重启是否成功,可以用 pgrep 再统计一次进程数,或者用 echo $? 是否为 0 判断。如果确认重启成功则 1 分钟后再重新统计 pgrep 数。如果重启不成功,则至多再检测 5 次,5次之后仍然重启失败,则放弃检测。
4) 发邮件时,可以写上邮件题目和内容。
3. 脚本
#!/bin/bash
# 重复检测 apache 是否重启成功的函数:
check_service()
{
n=0
for i in $(seq 1 5);do
/usr/local/apache2/bin/apachectl restart 2>/tmp/apache.err
if [ $? -ne 0 ];then
n=$[$n + 1]
else
break
fi
done
if [ $n -eq 5 ];then
#用发邮件的脚本发送邮件给管理员
python mail.py "[email protected]" "httpd service restart failed" "httpd process restart faild."
exit
fi
}
while true:
do
t_n=$(pgrep -l httpd | wc -l)
if [ $t_n -ge 500 ];then
/usr/local/apache2/bin/apachectl restart 2>/tmp/apache.err
if [ $? -ne 0 ];then
check_service
fi
sleep 60
s_n=$(pgrep -l httpd | wc -l)
if [ $s_n -ge 500 ];then
python mail.py "[email protected]" "httpd service has some wrong" "httpd process number is budy"
exit
fi
fi
sleep 10
done
4. 解释
1)连续重启 5 次 apache 服务的脚本,单独放在 check_service() 函数。利用变量 n 来计数,每重启失败一次,n+1,哪怕有一次成功都会被 break 终止 for 循环跳出。如果最后 for 循环累加了 5 次,就发送邮件,并且通过 exit 退出脚本。
2)如果 apache 第1次就重启成功,或者通过 check_service 在5次之内重启成功,脚本都会等待60s 后,再进行检测。注意看脚本中的判断顺序。
3)脚本中除了用 pgrep -l httpd 来统计 httpd 进程数以外,还可以用 ps -C httpd --no-heading 来代替,作用一样。
以上是关于shell 练习(13) —— 监控 httpd 进程数是否异常的主要内容,如果未能解决你的问题,请参考以下文章