linux运维之分析系统负载及运行状况
Posted 沉心十年
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了linux运维之分析系统负载及运行状况相关的知识,希望对你有一定的参考价值。
1.删除0字节文件
find -type f -size 0 -exec rm -rf {} \;
2.查看进程
#按内存从大到小排列 ps -e -o "%C : %p : %z : %a"|sort -k5 -nr
3.按cpu利用率从大到小排列
ps -e -o "%C : %p : %z : %a"|sort -nr
4.打印出cache里的URL
grep -r -a jpg /data/cache/* | strings | grep "http:" | awk -F‘http:‘ ‘{print "http:"$2;}‘
5.查看http的并发请求数及其TCP连接状态:
netstat -n | awk ‘/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}‘
6.禁止root远程登录
sed -i ‘/Root/s/no/yes/‘ /etc/ssh/sshd_config #sed在这个文里Root的一行,匹配Root一行,将no替换成yes.
7.杀掉mysql进程
ps aux |grep mysql |grep -v grep |awk ‘{print $2}‘ |xargs kill -9 killall -TERM mysqld kill -9 `cat /usr/local/apache2/logs/httpd.pid` #查杀进程PID 注:kill -9大绝招,慎用,会导致mysql不能启动等状况
8.显示运行3级别开启的服务
ls /etc/rc3.d/S* |cut -c 15-
9.编写SHELL输入多条信息,用EOF
cat << EOF ############################## # Welcome to aha services # ############################## EOF
10.内存的大小
free -m |grep "Mem" | awk ‘{print $2}‘
11、根据端口查看连接数
netstat -an -t | grep ":80" | grep ESTABLISHED | awk ‘{printf "%s %s\n",$5,$6}‘ | sort
12、查看Apache的并发请求数及其TCP连接状态
netstat -n | awk ‘/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}‘
13、统计一下服务器下面所有的jpg的文件的大小
find / -name *.jpg -exec wc -c {} \;|awk ‘{print $1}‘|awk ‘{a+=$1}END{print a}‘
14、CPU的数量
cat /proc/cpuinfo |grep -c processor
15、系统日志、硬件及网络负载查看
#cpu负载 cat /proc/loadavg #检查前三个输出值是否超过了系统逻辑CPU的4倍。 mpstat 1 1 #检查%idle是否过低(比如小于5%) #内存空间(free) cat /proc/meminfo #检查free值是否过低 #swap空间 vmstat 1 5 #检查swap used值是否过高 如果swap used值过高,进一步检查swap动作是否频繁,观察si和so值是否较大 #磁盘空间 df -h #检查是否有分区使用率(Use%)过高(比如超过90%); #如发现某个分区空间接近用尽,可以进入该分区的挂载点,用以下命令找出占用空间最多的文件或目录: du -cks * | sort -rn | head -n 10 #磁盘I/O负载 iostat -x 1 2 #检查I/O使用率(%util)是否超过100% #网络负载 sar -n DEV #检查网络流量(rxbyt/s, txbyt/s)是否过高 #网络错误 netstat -i #检查是否有网络错误(drop fifo colls carrier);也可以用命令:cat /proc/net/dev #网络连接数目 netstat -an | grep -E “^(tcp)” | cut -c 68- | sort | uniq -c | sort -n #进程总数 ps aux | wc -l #检查进程个数是否正常 #可运行进程数目 vmwtat 1 5 #列给出的是可运行进程的数目,检查其是否超过系统逻辑CPU的4倍 #进程 top -id 1 #观察是否有异常进程出现 #系统日志 cat /var/log/rflogview/*errors 检查是否有异常错误记录 也可以搜寻一些异常关键字,例如: grep -i error /var/log/messages grep -i fail /var/log/messages #核心日志 dmesg #检查是否有异常错误记录 #打开文件数目 lsof | wc -l #检查打开文件总数是否过多 #日志报告 logwatch –print #配置/etc/log.d/logwatch.conf,将 Mailto 设置为自己的email 地址,启动mail服务 (sendmail或者postfix),这样就可以每天收到日志报告了。 缺省logwatch只报告昨天的日志,可以用# logwatch –print –range all 获得所有的日志分析结果。 可以用# logwatch –print –detail high 获得更具体的日志分析结果(而不仅仅是出错日志)。
16、杀掉80端口相关的进程
lsof -i :80|grep -v "PID"|awk ‘{print "kill -9",$2}‘|sh
17、清除僵死进程
ps -eal | awk ‘{ if ($2 == "Z") {print $4}}‘ | kill -9
18、tcpdump 抓包 ,用来防止80端口被人攻击时可以分析数据
tcpdump -c 10000 -i eth0 -n dst port 80 > /root/pkts
19、然后检查IP的重复数 并从小到大排序 注意 "-t\ +0" 中间是两个空格
less pkts | awk {‘printf $3"\n"‘} | cut -d. -f 1-4 | sort | uniq -c | awk {‘printf $1" "$2"\n"‘} | sort -n -t\ +0
20、查看有多少个活动的php-cgi进程
netstat -anp | grep php-cgi | grep ^tcp | wc -l
chkconfig --list | awk ‘{if ($5=="3:on") print $1}‘
21、kudzu查看网卡型号
kudzu --probe --class=network
注:在线正则表达式
http://tool.oschina.net/regex
http://tools.jb51.net/regex/create_reg
以上是关于linux运维之分析系统负载及运行状况的主要内容,如果未能解决你的问题,请参考以下文章