五个常用的Linux监控脚本代码

Posted 2020-10-03

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了五个常用的Linux监控脚本代码相关的知识，希望对你有一定的参考价值。

1、首先，bash中0，1，2三个数字分别代表STDIN_FILENO、STDOUT_FILENO、STDERR_FILENO，即标准输入（一般是键盘），标准输出（一般是显示屏，准确的说是用户终端控制台），标准错误（出错信息输出）。

2、输入输出可以重定向，所谓重定向输入就是在命令中指定具体的输入来源，譬如 cat < test.c 将test.c重定向为cat命令的输入源。输出重定向是指定具体的输出目标以替换默认的标准输出，譬如ls > 1.txt将ls的结果从标准输出重定向为1.txt文本。有时候会看到如 ls >> 1.txt这类的写法，> 和 >> 的区别在于：> 用于新建而>>用于追加。即ls > 1.txt会新建一个1.txt文件并且将ls的内容输出到新建的1.txt中，而ls >> 1.txt则用在1.txt已经存在，而我们只是想将ls的内容追加到1.txt文本中的时候。

3、默认输入只有一个（0，STDIN_FILENO），而默认输出有两个（标准输出1 STDOUT_FILENO，标准错误2 STDERR_FILENO）。因此默认情况下，shell输出的错误信息会被输出到2，而普通输出信息会输出到1。但是某些情况下，我们希望在一个终端下看到所有的信息（包括标准输出信息和错误信息），要怎么办呢？

对了，你可以使用我们上面讲到的输出重定向。思路有了，怎么写呢？非常直观的想法就是2>1（将2重定向到1嘛），行不行呢？试一试就知道了。我们进行以下测试步骤：

1）mkdir test && cd test ; 创建test文件夹并进入test目录

2）touch a.txt b.c c ; 创建a.txt b.c c 三个文件

3）ls > 1 ; 按我们的猜测，这句应该是将ls的结果重定向到标准输出，因此效果和直接ls应该一样。但是实际这句执行后，标准输出中并没有任何信息。

4）ls ; 执行3之后再次ls，则会看到test文件夹中多了一个文件1

5）cat 1 ; 查看文件1的内容，实际结果为：1 a.txt b.c c 可见步骤3中 ls > 1并不是将ls的结果重定向为标准输出，而是将结果重定向到了一个文件1中。即1在此处不被解释为STDOUT_FILENO，而是文件1。

4、到了此时，你应该也能猜到2>&1的用意了。不错，2>&1就是用来将标准错误2重定向到标准输出1中的。此处1前面的&就是为了让bash将1解释成标准输出而不是文件1。至于最后一个&，则是让bash在后台执行。

1、查看主机网卡流量

复制代码代码如下:

#!/bin/bash
#network
#Mike.Xu
while : ; do
      time=‘date +%m"-"%d" "%k":"%M‘
      day=‘date +%m"-"%d‘
      rx_before=‘ifconfig eth0|sed -n "8"p|awk ‘{print $2}‘|cut -c7-‘
      tx_before=‘ifconfig eth0|sed -n "8"p|awk ‘{print $6}‘|cut -c7-‘
      sleep 2
      rx_after=‘ifconfig eth0|sed -n "8"p|awk ‘{print $2}‘|cut -c7-‘
      tx_after=‘ifconfig eth0|sed -n "8"p|awk ‘{print $6}‘|cut -c7-‘
      rx_result=$[(rx_after-rx_before)/256]
      tx_result=$[(tx_after-tx_before)/256]
      echo "$time Now_In_Speed: "$rx_result"kbps Now_OUt_Speed: "$tx_result"kbps"
      sleep 2
done

2、系统状况监控

复制代码代码如下:

#!/bin/sh
#systemstat.sh
#Mike.Xu
IP=192.168.1.227
top -n 2| grep "Cpu" >>./temp/cpu.txt
free -m | grep "Mem" >> ./temp/mem.txt
df -k | grep "sda1" >> ./temp/drive_sda1.txt
#df -k | grep sda2 >> ./temp/drive_sda2.txt
df -k | grep "/mnt/storage_0" >> ./temp/mnt_storage_0.txt
df -k | grep "/mnt/storage_pic" >> ./temp/mnt_storage_pic.txt
time=`date +%m"."%d" "%k":"%M`
connect=`netstat -na | grep "219.238.148.30:80" | wc -l`
echo "$time  $connect" >> ./temp/connect_count.txt

3、监控主机的磁盘空间,当使用空间超过90％就通过发mail来发警告

复制代码代码如下:

#!/bin/bash
#monitor available disk space
SPACE=‘df | sed -n ‘/ \ / $ / p‘ | gawk ‘{print $5}‘ | sed ‘s/%//‘
if [ $SPACE -ge 90 ]
then
[email protected]
fi

4、监控CPU和内存的使用情况

复制代码代码如下:

#!/bin/bash
#script  to capture system statistics
OUTFILE=/home/xu/capstats.csv
DATE=‘date +%m/%d/%Y‘
TIME=‘date +%k:%m:%s‘
TIMEOUT=‘uptime‘
VMOUT=‘vmstat 1 2‘
 USERS=‘echo $TIMEOUT | gawk ‘{print $4}‘ ‘
LOAD=‘echo $TIMEOUT | gawk ‘{print $9}‘ | sed "s/,//‘ ‘
FREE=‘echo $VMOUT | sed -n ‘/[0-9]/p‘ | sed -n ‘2p‘ | gawk ‘{print $4} ‘ ‘
IDLE=‘echo  $VMOUT | sed -n ‘/[0-9]/p‘ | sed -n ‘2p‘ |gawk ‘{print $15}‘ ‘
echo "$DATE,$TIME,$USERS,$LOAD,$FREE,$IDLE" >> $OUTFILE

5、全方位监控主机

复制代码代码如下:

#!/bin/bash
# check_xu.sh
# 0 * * * * /home/check_xu.sh

DAT="`date +%Y%m%d`"
HOUR="`date +%H`"
DIR="/home/oslog/host_${DAT}/${HOUR}"
DELAY=60
COUNT=60
# whether the responsible directory exist
if ! test -d ${DIR}
then
/bin/mkdir -p ${DIR}
fi
# general check
export TERM=linux
/usr/bin/top -b -d ${DELAY} -n ${COUNT} > ${DIR}/top_${DAT}.log 2>&1 &
# cpu check
/usr/bin/sar -u ${DELAY} ${COUNT} > ${DIR}/cpu_${DAT}.log 2>&1 &
#/usr/bin/mpstat -P 0 ${DELAY} ${COUNT} > ${DIR}/cpu_0_${DAT}.log 2>&1 &
#/usr/bin/mpstat -P 1 ${DELAY} ${COUNT} > ${DIR}/cpu_1_${DAT}.log 2>&1 &
# memory check
/usr/bin/vmstat ${DELAY} ${COUNT} > ${DIR}/vmstat_${DAT}.log 2>&1 &
# I/O check
/usr/bin/iostat ${DELAY} ${COUNT} > ${DIR}/iostat_${DAT}.log 2>&1 &
# network check
/usr/bin/sar -n DEV ${DELAY} ${COUNT} > ${DIR}/net_${DAT}.log 2>&1 &
#/usr/bin/sar -n EDEV ${DELAY} ${COUNT} > ${DIR}/net_edev_${DAT}.log 2>&1 &

放在crontab里每小时自动执行：
0 * * * * /home/check_xu.sh

这样便会在/home/oslog/host_yyyymmdd/hh目录下生成各小时cpu、内存、网络，IO的统计数据。
如果某个时间段产生问题了，就可以去看对应的日志信息，看看当时的主机性能如何。