shell+钉钉机器人完成java程序中断后自启动和实时监控

Posted 胖子学习天地

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了shell+钉钉机器人完成java程序中断后自启动和实时监控相关的知识,希望对你有一定的参考价值。

java实时程序在运行过程中偶尔出现异常信息中断的情况,通过shell脚本即可完成自启动。

以下为监控一个实时的java程序的shell脚本。

通过每10秒检查一次java程序的进程,来判断程序是否处于运行中。如果未发现程序,则执行程序的启动脚本。

对于启动过程中的状态信息,会通过钉钉机器人实时发送到监控群中,让维护人员了解到程序的异常。

在脚本中通过maxRetry来设置最大尝试的次数。

#!/bin/sh

#=============== java程序 begin ====================#
function callJavaProgram(){ nohup java -Djava.ext.dirs=lib com.Testjava 2>&1 & } #=============== java程序 end =======================# #=============== 发送钉钉的消息 begin ================# # 注意: ${nowtime}对应的日期参数不能有空格 # 注意: ${programe}为执行的jar程序的主程序名 url=\'https://oapi.dingtalk.com/robot/send?access_token=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx\' programe=TestJava server=192.168.0.101 content=\'\' logfile=testjava.log function sendDingtalk(){ java -Djava.ext.dirs=/home/hadoop/shell/robot/lib com.DingtalkRobot \\ ${1} ${2} ${3} ${4} ${5} } #sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content} #=============== 发送钉钉的消息 end ==================# # 最大尝试次数 maxRetry=3 # 尝试次数计数器 retryTimes=0 ( while true; do # 检测java程序执行的进程个数,如果小于1,则未启动 count=`ps -ef | grep ${programe} | grep -v grep|wc -l` #echo \'进程个数:\'$count >> ${logfile} nowtime=`date --date=\'0 days ago\' "+%Y-%m-%d_%H:%M:%S"` if [ ${count} -lt 1 ]; then retryTimes=$[$retryTimes+1] content=\'检测到程序【\'${programe}\'】未启动,正在尝试启动......第\'"${retryTimes}"\'\' echo ${nowtime} ${content} >> ${logfile} sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content} if [ $retryTimes -ge $maxRetry ]; then content=\'检测到程序【\'${programe}\'】异常,尝试启动\'"${maxRetry}"\'次失败,程序退出,请手工解决\' echo ${content} >> ${logfile} sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content} break fi #============== 这里执行java程序 =========================# callJavaProgram #============== 这里执行java程序 =========================# else if [ $retryTimes -gt 0 ]; then content=\'程序【\'${programe}\'】启动成功......第\'"${retryTimes}"\'\' echo ${content} >> ${logfile} sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content} else echo ${nowtime} \'程序【\'${programe}\'】......正在运行中\' >> ${logfile} fi let retryTimes=0 fi sleep 10 done ) & >> shell.log

 

脚本启动后:

可以查看到钉钉群中实时监控信息:

程序启动成功后,提示以下信息:

 

 

以上是关于shell+钉钉机器人完成java程序中断后自启动和实时监控的主要内容,如果未能解决你的问题,请参考以下文章

Shell中通过机器人发送钉钉群消息

shell 操作钉钉机器人实现告警提醒

zabbix 配合钉钉群机器人(webhook) 报警

钉钉群机器人Linux shell报警

钉钉群机器人Linux shell报警

56/14 shell脚本 后台启动 程序1 + “tail -f log“, ctrl +c 导致程序1中断