linux运维之分析系统负载及运行状况

Posted 2020-10-15 沉心十年

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了linux运维之分析系统负载及运行状况相关的知识，希望对你有一定的参考价值。

1.删除0字节文件

find -type f -size 0 -exec rm -rf {} \;

2.查看进程

#按内存从大到小排列
ps -e   -o "%C   : %p : %z : %a"|sort -k5 -nr

3.按cpu利用率从大到小排列

ps -e   -o "%C   : %p : %z : %a"|sort   -nr

4.打印出cache里的URL

grep -r -a   jpg /data/cache/* | strings | grep "http:" | awk -F‘http:‘ ‘{print "http:"$2;}‘

5.查看http的并发请求数及其TCP连接状态：

netstat -n | awk ‘/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}‘

6.禁止root远程登录

sed -i ‘/Root/s/no/yes/‘ /etc/ssh/sshd_config   #sed在这个文里Root的一行，匹配Root一行，将no替换成yes.

7.杀掉mysql进程

ps aux |grep mysql |grep -v grep  |awk ‘{print $2}‘ |xargs kill -9 
killall -TERM mysqld
kill -9 `cat /usr/local/apache2/logs/httpd.pid`   #查杀进程PID
注：kill -9大绝招，慎用，会导致mysql不能启动等状况

8.显示运行3级别开启的服务

ls /etc/rc3.d/S* |cut -c 15-

9.编写SHELL输入多条信息，用EOF

cat << EOF
##############################
#  Welcome to aha services   #
##############################
EOF

10.内存的大小

free -m |grep "Mem" | awk ‘{print $2}‘

11、根据端口查看连接数

netstat -an -t | grep ":80" | grep ESTABLISHED | awk ‘{printf "%s %s\n",$5,$6}‘ | sort

12、查看Apache的并发请求数及其TCP连接状态

netstat -n | awk ‘/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}‘

13、统计一下服务器下面所有的jpg的文件的大小

find / -name *.jpg -exec wc -c {} \;|awk ‘{print $1}‘|awk ‘{a+=$1}END{print a}‘

14、CPU的数量

cat /proc/cpuinfo |grep -c processor

15、系统日志、硬件及网络负载查看

#cpu负载
cat /proc/loadavg     #检查前三个输出值是否超过了系统逻辑CPU的4倍。
mpstat 1 1              #检查%idle是否过低(比如小于5%)

#内存空间（free）
cat /proc/meminfo   #检查free值是否过低

#swap空间
vmstat 1 5         #检查swap used值是否过高   如果swap used值过高，进一步检查swap动作是否频繁,观察si和so值是否较大

#磁盘空间
df -h    #检查是否有分区使用率(Use%)过高(比如超过90%)；
#如发现某个分区空间接近用尽，可以进入该分区的挂载点，用以下命令找出占用空间最多的文件或目录：
du -cks * | sort -rn | head -n 10

#磁盘I/O负载
iostat -x 1 2    #检查I/O使用率(%util)是否超过100%

#网络负载 
sar -n DEV    #检查网络流量(rxbyt/s, txbyt/s)是否过高

#网络错误  
netstat -i      #检查是否有网络错误(drop fifo colls carrier);也可以用命令：cat /proc/net/dev

#网络连接数目
netstat -an | grep -E “^(tcp)” | cut -c 68- | sort | uniq -c | sort -n

#进程总数 
ps aux | wc -l        #检查进程个数是否正常

#可运行进程数目
vmwtat 1 5           #列给出的是可运行进程的数目，检查其是否超过系统逻辑CPU的4倍

#进程
top -id 1    #观察是否有异常进程出现

#系统日志
cat /var/log/rflogview/*errors
检查是否有异常错误记录   也可以搜寻一些异常关键字，例如：
grep -i error /var/log/messages
grep -i fail /var/log/messages

#核心日志
dmesg      #检查是否有异常错误记录

#打开文件数目
lsof | wc -l             #检查打开文件总数是否过多

#日志报告
logwatch –print     #配置/etc/log.d/logwatch.conf，将 Mailto 设置为自己的email 地址，启动mail服务 (sendmail或者postfix)，这样就可以每天收到日志报告了。
缺省logwatch只报告昨天的日志，可以用# logwatch –print –range all 获得所有的日志分析结果。
可以用# logwatch –print –detail high 获得更具体的日志分析结果(而不仅仅是出错日志)。

16、杀掉80端口相关的进程

lsof -i :80|grep -v "PID"|awk ‘{print "kill -9",$2}‘|sh

17、清除僵死进程
ps -eal | awk ‘{ if ($2 == "Z") {print $4}}‘ | kill -9

18、tcpdump 抓包，用来防止80端口被人攻击时可以分析数据

tcpdump -c 10000 -i eth0 -n dst port 80 > /root/pkts

19、然后检查IP的重复数并从小到大排序注意 "-t\ +0" 中间是两个空格

less pkts | awk {‘printf $3"\n"‘} | cut -d. -f 1-4 | sort | uniq -c | awk {‘printf $1" "$2"\n"‘} | sort -n -t\ +0

20、查看有多少个活动的php-cgi进程

netstat -anp | grep php-cgi | grep ^tcp | wc -l
chkconfig --list | awk ‘{if ($5=="3:on") print $1}‘

21、kudzu查看网卡型号

kudzu --probe --class=network

注：在线正则表达式

http://tool.oschina.net/regex

http://tools.jb51.net/regex/create_reg

以上是关于linux运维之分析系统负载及运行状况的主要内容，如果未能解决你的问题，请参考以下文章