生产环境监控mysql服务状态

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了生产环境监控mysql服务状态相关的知识,希望对你有一定的参考价值。

在生产环境中,如果某个重要的服务关闭了,可能会产生不可预料的结果,这时候,我们要作一个脚本,这个脚本可以监控服务状态,在服务关闭的时候,可以自动打开服务,确保用户的利益。

下面我自己写了一个监控mysql服务的脚本,目前还没有发现bug,如果有大神发现bug的话可以和我说一下哈,本人QQ:1090139534,我也是刚刚学习的,大家可以加我和我交流。

#3306是mysqld服务的端口,看看是否是LISTEN状态。

stat="`netstat -lnt|grep 3306 |grep  LISTEN`" 

#判断$stat是否为空

if [ -z "$stat" ]; 

then

#如果为空就重启服务

/etc/init.d/mysqld restart 

#判断上面的服务是否重启成功,如果失败就输出the mysql service restart fail

[ $? -ne 0 ] && echo "the mysql service restart fail" 

else

#如果$stat不为空就输出the mysql service is running

echo "the mysql service is running" 

fi

下面我们来实现一下。

[[email protected] shell]# service mysqld status

mysqld (pid  53476) 正在运行...

[[email protected] shell]# service mysqld stop

停止 mysqld:                                              [确定]

[[email protected] shell]# sh db_check.sh 

停止 mysqld:                                              [确定]

正在启动 mysqld:                                           [确定]

[[email protected] shell]# sh db_check.sh 

the mysql service is running

以上是我自己写的,下面这个是老师写的

#!/bin/bash

#查看3306端口有没有开启,并算出3306的行数

portNum=`netstat -lnt|grep 3306|wc -l`

#判断行数是否为0

if [ $portNum -ne 0 ];

then

#如果行数不为0就说明在运行

echo "mysql is running"

else

#如果行数为0就说明不在运行,就要重启服务

/etc/init.d/mysqld restart

fi

下面是运行效果

[[email protected] shell]# service mysqld stop

停止 mysqld:                                              [确定]

[[email protected] shell]# sh db_check1.sh    

停止 mysqld:                                              [确定]

正在启动 mysqld:                                          [确定]

[[email protected] shell]# 

最好就是转化为数字,老师就是这样弄的,上面之所以把脚本的名字改为db_check.sh是因为我们还有一个题目,这个题目是要查询mysql进程的,如果你的脚本里面有mysql的字眼,可能会影响结果。

一般我们写脚本的时候,可以先看看在脚本里面执行的话是什么结果,比如说,我们可以先看看mysqld服务正常启动的时候,命令ps -aux | grep mysql |wc -l和命令netstat -lnt|grep 3306 |grep  LISTEN的结果是什么,这样方便我们写脚本。

[[email protected] shell]# service mysqld status

mysqld (pid  54334) 正在运行...

[[email protected] shell]# ps -ef | grep mysql |wc -l

3

[[email protected] shell]# netstat -lnt|grep 3306 |grep  LISTEN

tcp        0      0 0.0.0.0:3306                0.0.0.0:*                   LISTEN 

下面是我写的脚本,这个脚本和上面一样的功能,不同的是还要验证Mysql有没有运行进程,如果没有,还是要重启服务

#!/bin/bash

stat="`netstat -lnt|grep 3306 |grep  LISTEN`"

progress="`ps -ef | grep mysql |wc -l`" 

#3306是mysqld服务的端口,看看是否是LISTEN状态。

if [ -z "$stat" -a "$progress" -ne 1 ];

#判断$stat是否为空

then

/etc/init.d/mysqld restart

#如果为空就重启服务

[ $? -ne 0 ] && echo "the mysql service restart fail" 

#判断上面的服务是否重启成功,如果失败就输出the mysql service restart fail

else

echo "the mysql service is running" 

#如果$stat不为空就输出the mysql service is running

fi

下面这个是在生产环境中脚本,可以看看

#!/bin/bash

MYSQL=/etc/init.d/mysqld

LogPath=/tmp/mysqld.log

portNum=`netstat -lnt|grep 3306|wc -l`

mysqlProcessNum=`ps -ef|grep mysqld|grep -v grep|wc -l`

if [[ $portNum -eq 1 && $mysqlProcessNum -eq 2  ]];then

        echo "mysqld is running"

else

        $MYSQL start >$LogPath

        portNum=`netstat -lnt|grep 3306|wc -l`

        mysqlProcessNum=`ps -ef|grep mysqld|grep -v grep|wc -l`

        if [[ $portNum -ne 1 && $mysqlProcessNum -ne 2 ]];then

          while true #因为有时候我们杀死一个进程可能杀不死,所以我们要不断的杀这个进程

          do

                killall mysqld >/dev/null 2>&1

#如果这个进程给我们杀死了,再执行这个命令时就会提示没有可以杀的进程,这样,我们杀死进程的>

命令就会执行不了了,这样$?就不等于0,这时候就说明我们已经完全杀了这个进程啦。就可以跳出这>

个循环

                [ $? -ne 0 ] && break

                sleep 1

          done

                $MYSQL start >>$LogPath && status="successful"||status="failure"

                mail -s "mysql startup status is $status" [email protected] <$LogPath

        fi

fi

还有一种就是比较高级的,它的判断是:用一个用户去登录,看看能不能登录上,登录上了还要自动的去查询版本,再看看上面的命令有没有成功,如果成功了就说明mysql在运行,下面是我自己写的

#!/bin/bash

MYSQL=/etc/init.d/mysqld

LogPath=/tmp/mysqld.log

mysql -uroot -p123456 -e "select version();" >&/dev/null

if [ $? -eq 0  ];then

        echo "mysqld is running"

else

        $MYSQL start >$LogPath

        mysql -uroot -p123456 -e "select version();" >&/dev/null

        if [ $? -ne 0  ];then

          while true #因为有时候我们杀死一个进程可能杀不死,所以我们要不断的杀这个进程

          do

                killall mysqld >/dev/null 2>&1

#如果这个进程给我们杀死了,再执行这个命令时就会提示没有可以杀的进程,这样,我们杀死进程的>

命令就会执行不了了,这样$?就不等于0,这时候就说明我们已经完全杀了这个进程啦。就可以跳出这>

个循环

                [ $? -ne 0 ] && break

                sleep 1

          done

                $MYSQL start >>$LogPath && status="successful"||status="failure"

                mail -s "mysql startup status is $status" [email protected] <$LogPath

        fi

fi

可是我们发现,这个只是针对我们这台机的账号密码,如果是别的账号密码呢?这时候我们可以作一个脚本,这个脚本是专门用来写账号密码的,多说无益,我们来实验一下吧

首先先写一个放账号密码的脚本。把我们的账号密码放进去

#!/bin/bash

user=root

password=123456

下面我们对上面的那个脚本改造一下,把上面的用户root改为变量$user把密码123456改为变量$password如下

#!/bin/bash

MYSQL=/etc/init.d/mysqld

LogPath=/tmp/mysqld.log

mysql -u$user -p$password -e "select version();" >&/dev/null

if [ $? -eq 0  ];then

        echo "mysqld is running"

else

        $MYSQL start >$LogPath

        mysql -u$user -p$password -e "select version();" >&/dev/null

        if [ $? -ne 0  ];then

          while true #因为有时候我们杀死一个进程可能杀不死,所以我们要不断的杀这个进程

          do

                killall mysqld >/dev/null 2>&1

#如果这个进程给我们杀死了,再执行这个命令时就会提示没有可以杀的进程,这样,我们杀死进程的>

命令就会执行不了了,这样$?就不等于0,这时候就说明我们已经完全杀了这个进程啦。就可以跳出这>

个循环

                [ $? -ne 0 ] && break

                sleep 1

          done

                $MYSQL start >>$LogPath && status="successful"||status="failure"

                mail -s "mysql startup status is $status" [email protected] <$LogPath

        fi

fi

我们去看看效果

[[email protected] shell]# source database.sh 

[[email protected] shell]# source db_check3.sh 

mysqld is running

[email protected] shell]# service mysqld stop

停止 mysqld:                                              [确定]

[[email protected] shell]# source db_check3.sh

[[email protected] shell]# 

最后这种方法是老师推荐的,也是最简单的一种方法

这个方法是用php/java程序监控mysql

这个方法我不知道怎么写,老师也只是提一下,上面的脚本都有一个Bug,就算我们的数据库正常,可是用户访问出问题了,那也没有用呀,而用php/java的方法就不一样,这个方法是模拟用户去访问我们的网站,如果访问正常就正常,这样比较贴近用户。

本文出自 “爱周瑜” 博客,请务必保留此出处http://izhouyu.blog.51cto.com/10318932/1891756

以上是关于生产环境监控mysql服务状态的主要内容,如果未能解决你的问题,请参考以下文章

生产环境MySQL死锁如何监控及如何减少死锁发生的概率。

zabbix项目实践

zabbix监控mysql

生产环境下:LAMP源码安装,搭建zabbix监控

生产环境mysql内存溢出重启简单分析

你的生产环境还在“裸奔”吗?给服务器上个监控吧