CPU上下文切换
Posted 顧棟
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了CPU上下文切换相关的知识,希望对你有一定的参考价值。
文章目录
CPU上下文切换
什么是CPU上下文
CPU寄存器包含指令寄存器(IR)和程序计数器(PC)。他们用来暂存指令,数据和地址,以及程序运行的下一条指令地址,这些都是任务运行时的必要环境。这些也被称为上下文。上下文切换就是把当前任务的CPU上下文保存起来,然后加载新任务的上下文到这些指令寄存器(IR)和程序寄存器(PC)等寄存器中。这些被保存下来的上下文会存储在操作系统的内核中,等待任务重新调度执行时再次加载进来,这样就能保证任务的原来状态不受影响,让任务看起来是连续运行的。
CPU的上下文切换分为进程上下文切换、线程上下文切换、中断上下文切换。
进程上下文切换
特权模式切换
Linux 按照特权等级,把进程的运行空间分为内核空间和用户空间,分别对应 CPU 特权等级的 Ring 0 和 Ring 3。(Ring 2和Ring 1,Linux没用到)
- 内核空间(Ring 0)具有最高权限,可以直接访问所有资源;
- 用户空间(Ring 3)只能访问受限资源,不能直接访问内存等硬件设备,必须通过系统调用陷入到内核中,才能访问这些特权资源。
进程在用户空间运行时,被称为进程的用户态,而陷入内核空间的时候,被称为进程的内核态。
从用户态到内核态的转变,就发生了一次特权模式的切换,需要通过系统调用来完成。比如,当我们查看文件内容时,就需要多次系统调用来完成:首先调用 open() 打开文件,然后调用 read() 读取文件内容,并调用 write() 将内容写到标准输出,最后再调用 close() 关闭文件。
每一次的系统调用,CPU 寄存器会将当前进程的用户态的指令位置保存起来。再去更新内核态指令的位置,最后才是跳转到内核态运行内核任务。而系统调用结束后,CPU 寄存器需要恢复原来用户保存的状态,然后再切换到用户空间,继续运行进程。可以发现,一次的系统调用的过程中会发生两次CPU上下文切换(由用户态进入内核态一次,由内核态进入用户态是第二次)。这种不涉及多个进程,只在一个进程的用户态和内核态之间的系统调用中的CPU上下文切换,通常可以称为特权模式切换。
进程上下文切换与系统调用的区别
这里的进程上下文切指不同进程之间的CPU上下文切换。
首先,进程是由内核来管理和调度的,进程的切换只能发生在内核态。所以,进程的上下文不仅包括了虚拟内存、栈、全局变量等用户空间的资源,还包括了内核堆栈、寄存器等内核空间的状态。
不同进程之间一次上下文切换过程:
- 首先将进程的虚拟内存、栈等信息保存下再去保存当前进程的内核态和CPU寄存器的信息
- 加载下一个进程的虚拟内存,栈等信息,内核态等信息
- 刷新进程的虚拟内存和用户栈
- 执行下一个进程
可以发现进程间的上下文切换就比系统调用时多了一步:在保存当前进程的信息后;加载了下一进程的内核态后,还需要刷新进程的虚拟内存和用户栈。
上下文的切换是有开销的,进程上下文切换的次数多了,会导致CPU大量的时间并没有用到真正执行进程上,会对性能产生较大的影响了。
Linux 通过 TLB(Translation Lookaside Buffer)来管理虚拟内存到物理内存的映射关系。当虚拟内存更新后,TLB 也需要刷新,内存的访问也会随之变慢。特别是在多处理器系统上,缓存(L3)是被多个处理器共享的,刷新缓存不仅会影响当前处理器的进程,还会影响共享缓存的其他处理器的进程。
什么时候会切换进程上下文?
进程切换时才需要切换上下文,换句话说,只有在进程调度的时候,才需要切换上下文。Linux 为每个 CPU 都维护了一个就绪队列,将活跃进程(即正在运行和正在等待 CPU 的进程)按照优先级和等待 CPU 的时间排序,然后选择最需要 CPU 的进程,也就是优先级最高和等待 CPU 时间最长的进程来运行。
那么,进程在什么时候才会被调度到 CPU 上运行呢?
最容易想到的一个时机,就是进程执行完终止了,它之前使用的 CPU 会释放出来,这个时候再从就绪队列里,拿一个新的进程过来运行。其实还有很多其他场景,也会触发进程调度,在这里我给你逐个梳理下。
1. 为了保证所有进程可以得到公平调度,CPU 时间被划分为一段段的时间片,这些时间片再被轮流分配给各个进程。这样,当某个进程的时间片耗尽了,就会被系统挂起,切换到其它正在等待 CPU 的进程运行。
1. 进程在系统资源不足(比如内存不足)时,要等到资源满足后才可以运行,这个时候进程也会被挂起,并由系统调度其他进程运行。
1. 当进程通过睡眠函数 sleep 这样的方法将自己主动挂起时,自然也会重新调度。
1. 当有优先级更高的进程运行时,为了保证高优先级进程的运行,当前进程会被挂起,由高优先级进程来运行。
1. 发生硬件中断时,CPU 上的进程会被中断挂起,转而执行内核中的中断服务程序。
线程上下文切换
线程与进程最大的区别在于,线程是调度的基本单位,而进程则是资源拥有的基本单位。内核中的任务调度,实际上的调度对象是线程,而进程只是给线程提供了虚拟内存、全局变量等资源。所以,对于线程和进程,我们可以这么理解:
- 当进程只有一个线程时,可以认为进程就等于线程。
- 当进程拥有多个线程时,这些线程会共享相同的虚拟内存和全局变量等资源。这些资源在上下文切换时是不需要修改的。
- 另外,线程也有自己的私有数据,比如栈和寄存器等,这些在上下文切换时也是需要保存的。
那么线程的上下分可以分为
- 进程内线程的上下文切换
- 进程间线程的上下文切换
理解为:进程内的线程上下文切换吗,会有共享的资源不需要保存和重新加载,比进程间的线程上下文切换消耗更少的资源。合理的在进程内使用多线程可以提高效率和负载。
中断上下文切换
为了快速响应硬件的事件,中断处理会打断进程的正常调度和执行,转而调用中断处理程序,响应设备事件。而在打断其他进程时,就需要将进程当前的状态保存下来,这样在中断结束后,进程仍然可以从原来的状态恢复运行。
对同一个 CPU 来说,中断处理比进程拥有更高的优先级,所以中断上下文切换并不会与进程上下文切换同时发生。同样道理,由于中断会打断正常进程的调度和执行,所以大部分中断处理程序都短小精悍,以便尽可能快的执行结束。
另外,跟进程上下文切换一样,中断上下文切换也需要消耗 CPU,切换次数过多也会耗费大量的 CPU,甚至严重降低系统的整体性能。所以,当你发现中断次数过多时,就需要注意去排查它是否会给你的系统带来严重的性能问题。
监控上下文切换
vmstat
命令vmstat 1
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
1 0 65740 2186336 0 1117444 2 1 31 3 0 0 4 1 94 0 1
1 0 65740 2185452 0 1117484 0 0 0 0 1444 1403 2 2 96 0 0
0 0 65740 2185408 0 1117496 0 0 0 32 1189 1172 0 1 98 0 1
0 0 65740 2186020 0 1117468 0 0 0 0 1279 1228 1 1 98 0 0
0 0 65740 2185244 0 1117496 0 0 0 0 1741 1569 2 2 96 0 0
0 0 65740 2186148 0 1117520 0 0 0 0 1079 1116 1 1 98 0 0
0 0 65740 2186108 0 1117532 0 0 0 25 1100 1171 1 1 99 0 0
0 0 65740 2185020 0 1117464 0 0 0 12 1616 1457 2 2 96 0 0
0 0 65740 2184912 0 1117512 0 0 0 0 1297 1276 1 1 99 0 0
0 0 65740 2185372 0 1117500 0 0 0 0 1347 1345 1 1 98 0 0
0 0 65740 2183784 0 1117464 0 0 0 8 1551 1411 2 2 96 0 0
0 0 65740 2184504 0 1117504 0 0 0 0 1068 1144 1 1 98 0 0
2 0 65740 2185308 0 1117484 0 0 0 12 1164 1166 1 1 98 0 0
0 0 65740 2185240 0 1117428 0 0 0 0 1573 1469 2 2 96 0 0
cs 每秒上下文切换次数,上下文切换次数过多表示你的CPU大部分浪费在上下文切换,导致CPU干正经事的时间少了,CPU没有充分利用,是不可取的。
其他解释
cs 每秒上下文切换次数。上下文切换次数过多表示你的CPU大部分浪费在上下文切换,导致CPU干正经事的时间少了,CPU没有充分利用,是不可取的。
其他解释
r 表示运行队列(就是说多少个进程真的分配到CPU),我测试的服务器目前CPU比较空闲,没什么程序在跑,当这个值超过了CPU数目,就会出现CPU瓶颈了。这个也和top的负载有关系,一般负载超过了3就比较高,超过了5就高,超过了10就不正常了,服务器的状态很危险。top的负载类似每秒的运行队列。如果运行队列过大,表示你的CPU很繁忙,一般会造成CPU使用率很高。
b 表示阻塞的进程。
swpd 虚拟内存已使用的大小,如果大于0,表示你的机器物理内存不足了,如果不是程序内存泄露的原因,那么你该升级内存了或者把耗内存的任务迁移到其他机器。单位k
free 空闲的物理内存的大小。
buff Linux/Unix系统是用来存储,目录里面有什么内容,权限等的缓存
cache cache直接用来记忆我们打开的文件,给文件做缓冲。
si 每秒从磁盘读入虚拟内存的大小,如果这个值大于0,表示物理内存不够用或者内存泄露了,要查找耗内存进程解决掉。(单位:kb/s)
so 每秒虚拟内存写入磁盘的大小,如果这个值大于0,同上。(单位:kb/s)
bi 块设备每秒接收的块数量,这里的块设备是指系统上所有的磁盘和其他块设备,默认块大小是1024byte。(单位:block)
bo 块设备每秒发送的块数量,例如我们读取文件,bo就要大于0。bi和bo一般都要接近0,不然就是IO过于频繁,需要调整。(单位:block)
in 每秒CPU的中断次数,包括时间中断。(以百分比表示)
us 用户CPU时间,用户进程执行消耗cpu时间(user time),us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期超过50%的使用,那么我们就该考虑优化程序算法或其他措施了。(以百分比表示)
sy 系统CPU时间,如果太高,表示系统调用时间长,例如是IO操作频繁。(以百分比表示)
id 空闲 CPU时间,一般来说,id + us + sy = 100,一般我认为id是空闲CPU使用率,us是用户CPU使用率,sy是系统CPU使用率。(以百分比表示)
wa 等待IO CPU时间。wa过高时,说明io等待比较严重,这可能是由于磁盘大量随机访问造成的,也有可能是磁盘的带宽出现瓶颈。(以百分比表示)
pidstat
命令pidstat -w 1
Linux 3.10.0-693.25.4.el7.x86_64 (bdessitapp05) 2022年03月18日 _x86_64_ (4 CPU)
16时45分32秒 UID PID cswch/s nvcswch/s Command
16时45分34秒 0 3 1.98 0.00 ksoftirqd/0
16时45分34秒 0 7 2.97 0.00 migration/0
16时45分34秒 0 9 75.25 0.00 rcu_sched
16时45分34秒 0 11 0.99 0.00 watchdog/1
16时45分34秒 0 12 8.91 0.00 migration/1
16时45分34秒 0 13 1.98 0.00 ksoftirqd/1
16时45分34秒 0 16 0.99 0.00 watchdog/2
16时45分34秒 0 17 4.95 0.00 migration/2
16时45分34秒 0 18 1.98 0.00 ksoftirqd/2
16时45分34秒 0 21 0.99 0.00 watchdog/3
16时45分34秒 0 22 11.88 0.00 migration/3
16时45分34秒 0 547 2.97 0.00 kworker/3:1H
16时45分34秒 0 868 19.80 0.00 xfsaild/dm-5
16时45分34秒 0 1109 0.99 0.00 pidstat
16时45分34秒 0 1131 7.92 0.99 bash
cswch (voluntary context switches) 自愿上下文切换,指的是进程无法获得所需的资源导致的上下文切换。比如I/O不足,内存不足。
nvcswch (non voluntary context switches) **非自愿上下文切换,指的是 进程由于时间片已到等原因,被系统强制调度,进而发生上下文切换。**比如大量进程在争抢CPU
减少上下文切换
- 无锁并发编程,多线程竞争锁的时候会引起上下文的切换,可以使用一些办法避免使用锁,如将数据的ID按照Hash算法取模分段,不同线程处理不同分段的数据。
- CAS算法,Java的Atomic中使用CAS算法来更新数据,不需要加锁。
- 使用最少线程,避免创建过多的不需要的线程,会造成大量等待状态的线程
- 协程,在单线程里实现多任务的调度,并在单线程中维持多个任务之间的切换。
参考:
https://www.jianshu.com/p/1c80cd47e8cf
https://www.cnblogs.com/winclpt/articles/10873024.html
https://www.cnblogs.com/ggjucheng/archive/2012/01/05/2312625.html
以上是关于CPU上下文切换的主要内容,如果未能解决你的问题,请参考以下文章