篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了linux 性能自我学习 ———— 理解平均负载 [一]相关的知识,希望对你有一定的参考价值。
前言
linux 系统上性能调查的自我学习。
正文
什么是平均负载?
使用uptime:
可以看到后面有:
0.03, 0.06, 0.09
这个表示1分钟,5分钟,15分钟的平均负载。
平均负债是指单位时间内,系统处于可运行状态和不可中断状态的平均进程数,也就是平均活跃进程数。
所谓可运行状态的进程,是指正在使用cpu或者正在等待cpu的进程,也就是我们常用的ps命令看到的,处于r状态(running 或runnable) 的进程。
不可中断状态的进程是正处于内核态关键中的流程,并且这些流程是不可打断的,比如最常见的是等待硬件设备的io响应,
也就是我们在ps命令中看到的d状态(uninterruptible sleep,也称disk sleep)的进程。
比如平均负载是2:
-
在只有两个cpu的系统上,意味着所有的cpu都刚好被完全占用。
-
在4个cpu的系统上,意味着cpu有50%的空闲。
-
在只有一个cpu的系统上,意味着有一半的进程竞争不到cpu。
什么时候平均负载合理:
查看cpu的个数:
grep \'model name\' /proc/cpuinfo | wc -l
如果平均负载超过了核数,那么是过载,那么就是说有进程没有竞争到cpu。
一般情况下,当平均负载高于cpu数量70%的时候,那么就应该增加配置或者调查一下原因。
而我们也是需要看cpu负载在1分钟,5分钟和15分钟。
如果15分钟的负载很高,而1分钟的负载不高,那么就说明负载开始下来了。
反之,是最近才上去的。
平均负载和cpu使用率的区别。
平均负载包括正在使用的cpu,还有等待的cpu还有等待io的进程。
而cpu使用率就是表面意思,就是cpu的使用情况。
-
cpu 密集型进程,使用大量的cpu会导致平均负载升高,此时两者是一致的。
-
i/o 密集型,等待io也会导致平均负载升高,但是cpu使用率不一定升高。
-
大量等待cpu的进程调度也会导致平均负载升高,此时的cpu使用率也会比较高。
下面对这3中情况,进行案例测试:
需要安装stress,sysstat.
- 模拟cpu 密集型进程
stress --cpu 2 --timeout 600
可以看到平均负载升高了。
查看cpu 使用率:
mpstat -P ALL 5
可以看到cpu 使用率被拉满了,但是iowait很低。
那么这个时候就是cpu密集型。
那么查看是哪个导致cpu使用100%。
使用pidstat:
pidstat -u 5 1
- 模拟cpu高的场景
stress -i 1 --hdd 1 --timeout 600
使用watch -d uptime:
使用mpstat 查看 mpstat -P -ALL 5 1:
然后使用pidstat -d 5 1:
可以看到是因为io的原因。
场景3,大量进程的场景:
模拟16个活跃进程的场景:
stress -c 16 --hdd 1 --timeout 600
负载情况:
可以看到io和cpu都不高:
因为进程太多。
结
下一节cpu 上下文切换。
平均负载是单位时间内, 系统处于可运行状态和不可中断状态的平均进程数( 平均活跃进程数 )
可运行状体好理解, 就是进程正在运行状态Running和可运行状态Runnable... 这里需要注意的是 不可中断状态(ps D状态)的进程是系统对进程的一种保护, 比如在写磁盘的时, 为了数据一致性, 当前的进程是不会被打断而切换上下文的...
下面的图片是对于linux性能查看和分析的步骤:
定位异常问题的步骤:
- 1.查看平均负载情况(uptime top htop atop)
- 2.cpu利用率(cat /proc/cpuinfo top mpstat)
- 3.查看io使用情况(iostat)
- 4.查看进程占用资源情况(ps pidstat)
个人尝试总结:
- 1.平均负载为70%较为合理
- 2.多种性能工具结合使用
- 3.负载更大, 不单单是cpu利用率增大, 还可能是io资源占有率过高