CPU上下文切换

Posted 顧棟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了CPU上下文切换相关的知识,希望对你有一定的参考价值。

文章目录

CPU上下文切换

什么是CPU上下文

CPU寄存器包含指令寄存器(IR)和程序计数器(PC)。他们用来暂存指令,数据和地址,以及程序运行的下一条指令地址,这些都是任务运行时的必要环境。这些也被称为上下文。上下文切换就是把当前任务的CPU上下文保存起来,然后加载新任务的上下文到这些指令寄存器(IR)和程序寄存器(PC)等寄存器中。这些被保存下来的上下文会存储在操作系统的内核中,等待任务重新调度执行时再次加载进来,这样就能保证任务的原来状态不受影响,让任务看起来是连续运行的。

CPU的上下文切换分为进程上下文切换、线程上下文切换、中断上下文切换。

进程上下文切换

特权模式切换

Linux 按照特权等级,把进程的运行空间分为内核空间和用户空间,分别对应 CPU 特权等级的 Ring 0 和 Ring 3。(Ring 2和Ring 1,Linux没用到)

  • 内核空间(Ring 0)具有最高权限,可以直接访问所有资源;
  • 用户空间(Ring 3)只能访问受限资源,不能直接访问内存等硬件设备,必须通过系统调用陷入到内核中,才能访问这些特权资源。

进程在用户空间运行时,被称为进程的用户态,而陷入内核空间的时候,被称为进程的内核态。

从用户态到内核态的转变,就发生了一次特权模式的切换,需要通过系统调用来完成。比如,当我们查看文件内容时,就需要多次系统调用来完成:首先调用 open() 打开文件,然后调用 read() 读取文件内容,并调用 write() 将内容写到标准输出,最后再调用 close() 关闭文件。

每一次的系统调用,CPU 寄存器会将当前进程的用户态的指令位置保存起来。再去更新内核态指令的位置,最后才是跳转到内核态运行内核任务。而系统调用结束后,CPU 寄存器需要恢复原来用户保存的状态,然后再切换到用户空间,继续运行进程。可以发现,一次的系统调用的过程中会发生两次CPU上下文切换(由用户态进入内核态一次,由内核态进入用户态是第二次)。这种不涉及多个进程,只在一个进程的用户态和内核态之间的系统调用中的CPU上下文切换,通常可以称为特权模式切换

进程上下文切换与系统调用的区别

这里的进程上下文切指不同进程之间的CPU上下文切换。

首先,进程是由内核来管理和调度的,进程的切换只能发生在内核态。所以,进程的上下文不仅包括了虚拟内存、栈、全局变量等用户空间的资源,还包括了内核堆栈、寄存器等内核空间的状态。

不同进程之间一次上下文切换过程:

  1. 首先将进程的虚拟内存、栈等信息保存下再去保存当前进程的内核态和CPU寄存器的信息
  2. 加载下一个进程的虚拟内存,栈等信息,内核态等信息
  3. 刷新进程的虚拟内存和用户栈
  4. 执行下一个进程

可以发现进程间的上下文切换就比系统调用时多了一步:在保存当前进程的信息后;加载了下一进程的内核态后,还需要刷新进程的虚拟内存和用户栈。

上下文的切换是有开销的,进程上下文切换的次数多了,会导致CPU大量的时间并没有用到真正执行进程上,会对性能产生较大的影响了。

Linux 通过 TLB(Translation Lookaside Buffer)来管理虚拟内存到物理内存的映射关系。当虚拟内存更新后,TLB 也需要刷新,内存的访问也会随之变慢。特别是在多处理器系统上,缓存(L3)是被多个处理器共享的,刷新缓存不仅会影响当前处理器的进程,还会影响共享缓存的其他处理器的进程。

什么时候会切换进程上下文?

进程切换时才需要切换上下文,换句话说,只有在进程调度的时候,才需要切换上下文。Linux 为每个 CPU 都维护了一个就绪队列,将活跃进程(即正在运行和正在等待 CPU 的进程)按照优先级和等待 CPU 的时间排序,然后选择最需要 CPU 的进程,也就是优先级最高和等待 CPU 时间最长的进程来运行。

那么,进程在什么时候才会被调度到 CPU 上运行呢?

最容易想到的一个时机,就是进程执行完终止了,它之前使用的 CPU 会释放出来,这个时候再从就绪队列里,拿一个新的进程过来运行。其实还有很多其他场景,也会触发进程调度,在这里我给你逐个梳理下。

1. 为了保证所有进程可以得到公平调度,CPU 时间被划分为一段段的时间片,这些时间片再被轮流分配给各个进程。这样,当某个进程的时间片耗尽了,就会被系统挂起,切换到其它正在等待 CPU 的进程运行。
1. 进程在系统资源不足(比如内存不足)时,要等到资源满足后才可以运行,这个时候进程也会被挂起,并由系统调度其他进程运行。
1. 当进程通过睡眠函数 sleep 这样的方法将自己主动挂起时,自然也会重新调度。
1. 当有优先级更高的进程运行时,为了保证高优先级进程的运行,当前进程会被挂起,由高优先级进程来运行。
1. 发生硬件中断时,CPU 上的进程会被中断挂起,转而执行内核中的中断服务程序。

线程上下文切换

线程与进程最大的区别在于,线程是调度的基本单位,而进程则是资源拥有的基本单位。内核中的任务调度,实际上的调度对象是线程,而进程只是给线程提供了虚拟内存、全局变量等资源。所以,对于线程和进程,我们可以这么理解:

  • 当进程只有一个线程时,可以认为进程就等于线程。
  • 当进程拥有多个线程时,这些线程会共享相同的虚拟内存和全局变量等资源。这些资源在上下文切换时是不需要修改的。
  • 另外,线程也有自己的私有数据,比如栈和寄存器等,这些在上下文切换时也是需要保存的。

那么线程的上下分可以分为

  1. 进程内线程的上下文切换
  2. 进程间线程的上下文切换

理解为:进程内的线程上下文切换吗,会有共享的资源不需要保存和重新加载,比进程间的线程上下文切换消耗更少的资源。合理的在进程内使用多线程可以提高效率和负载。

中断上下文切换

为了快速响应硬件的事件,中断处理会打断进程的正常调度和执行,转而调用中断处理程序,响应设备事件。而在打断其他进程时,就需要将进程当前的状态保存下来,这样在中断结束后,进程仍然可以从原来的状态恢复运行。

对同一个 CPU 来说,中断处理比进程拥有更高的优先级,所以中断上下文切换并不会与进程上下文切换同时发生。同样道理,由于中断会打断正常进程的调度和执行,所以大部分中断处理程序都短小精悍,以便尽可能快的执行结束。

另外,跟进程上下文切换一样,中断上下文切换也需要消耗 CPU,切换次数过多也会耗费大量的 CPU,甚至严重降低系统的整体性能。所以,当你发现中断次数过多时,就需要注意去排查它是否会给你的系统带来严重的性能问题。

监控上下文切换

vmstat

命令vmstat 1

procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 1  0  65740 2186336      0 1117444    2    1    31     3    0    0  4  1 94  0  1
 1  0  65740 2185452      0 1117484    0    0     0     0 1444 1403  2  2 96  0  0
 0  0  65740 2185408      0 1117496    0    0     0    32 1189 1172  0  1 98  0  1
 0  0  65740 2186020      0 1117468    0    0     0     0 1279 1228  1  1 98  0  0
 0  0  65740 2185244      0 1117496    0    0     0     0 1741 1569  2  2 96  0  0
 0  0  65740 2186148      0 1117520    0    0     0     0 1079 1116  1  1 98  0  0
 0  0  65740 2186108      0 1117532    0    0     0    25 1100 1171  1  1 99  0  0
 0  0  65740 2185020      0 1117464    0    0     0    12 1616 1457  2  2 96  0  0
 0  0  65740 2184912      0 1117512    0    0     0     0 1297 1276  1  1 99  0  0
 0  0  65740 2185372      0 1117500    0    0     0     0 1347 1345  1  1 98  0  0
 0  0  65740 2183784      0 1117464    0    0     0     8 1551 1411  2  2 96  0  0
 0  0  65740 2184504      0 1117504    0    0     0     0 1068 1144  1  1 98  0  0
 2  0  65740 2185308      0 1117484    0    0     0    12 1164 1166  1  1 98  0  0
 0  0  65740 2185240      0 1117428    0    0     0     0 1573 1469  2  2 96  0  0

cs 每秒上下文切换次数,上下文切换次数过多表示你的CPU大部分浪费在上下文切换,导致CPU干正经事的时间少了,CPU没有充分利用,是不可取的。

其他解释

cs 每秒上下文切换次数。上下文切换次数过多表示你的CPU大部分浪费在上下文切换,导致CPU干正经事的时间少了,CPU没有充分利用,是不可取的。

其他解释

r 表示运行队列(就是说多少个进程真的分配到CPU),我测试的服务器目前CPU比较空闲,没什么程序在跑,当这个值超过了CPU数目,就会出现CPU瓶颈了。这个也和top的负载有关系,一般负载超过了3就比较高,超过了5就高,超过了10就不正常了,服务器的状态很危险。top的负载类似每秒的运行队列。如果运行队列过大,表示你的CPU很繁忙,一般会造成CPU使用率很高。

b 表示阻塞的进程。

swpd 虚拟内存已使用的大小,如果大于0,表示你的机器物理内存不足了,如果不是程序内存泄露的原因,那么你该升级内存了或者把耗内存的任务迁移到其他机器。单位k

free 空闲的物理内存的大小。

buff Linux/Unix系统是用来存储,目录里面有什么内容,权限等的缓存

cache cache直接用来记忆我们打开的文件,给文件做缓冲。

si 每秒从磁盘读入虚拟内存的大小,如果这个值大于0,表示物理内存不够用或者内存泄露了,要查找耗内存进程解决掉。(单位:kb/s)

so 每秒虚拟内存写入磁盘的大小,如果这个值大于0,同上。(单位:kb/s)

bi 块设备每秒接收的块数量,这里的块设备是指系统上所有的磁盘和其他块设备,默认块大小是1024byte。(单位:block)

bo 块设备每秒发送的块数量,例如我们读取文件,bo就要大于0。bi和bo一般都要接近0,不然就是IO过于频繁,需要调整。(单位:block)

in 每秒CPU的中断次数,包括时间中断。(以百分比表示)

us 用户CPU时间,用户进程执行消耗cpu时间(user time),us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期超过50%的使用,那么我们就该考虑优化程序算法或其他措施了(以百分比表示)

sy 系统CPU时间,如果太高,表示系统调用时间长,例如是IO操作频繁。(以百分比表示)

id 空闲 CPU时间,一般来说,id + us + sy = 100,一般我认为id是空闲CPU使用率,us是用户CPU使用率,sy是系统CPU使用率。(以百分比表示)

wa 等待IO CPU时间。wa过高时,说明io等待比较严重,这可能是由于磁盘大量随机访问造成的,也有可能是磁盘的带宽出现瓶颈。(以百分比表示)

pidstat

命令pidstat -w 1

Linux 3.10.0-693.25.4.el7.x86_64 (bdessitapp05)         2022年03月18日  _x86_64_        (4 CPU)

16时45分32秒   UID       PID   cswch/s nvcswch/s  Command
16时45分34秒     0         3      1.98      0.00  ksoftirqd/0
16时45分34秒     0         7      2.97      0.00  migration/0
16时45分34秒     0         9     75.25      0.00  rcu_sched
16时45分34秒     0        11      0.99      0.00  watchdog/1
16时45分34秒     0        12      8.91      0.00  migration/1
16时45分34秒     0        13      1.98      0.00  ksoftirqd/1
16时45分34秒     0        16      0.99      0.00  watchdog/2
16时45分34秒     0        17      4.95      0.00  migration/2
16时45分34秒     0        18      1.98      0.00  ksoftirqd/2
16时45分34秒     0        21      0.99      0.00  watchdog/3
16时45分34秒     0        22     11.88      0.00  migration/3
16时45分34秒     0       547      2.97      0.00  kworker/3:1H
16时45分34秒     0       868     19.80      0.00  xfsaild/dm-5
16时45分34秒     0      1109      0.99      0.00  pidstat
16时45分34秒     0      1131      7.92      0.99  bash

cswch (voluntary context switches) 自愿上下文切换,指的是进程无法获得所需的资源导致的上下文切换。比如I/O不足,内存不足。

nvcswch (non voluntary context switches) **非自愿上下文切换,指的是 进程由于时间片已到等原因,被系统强制调度,进而发生上下文切换。**比如大量进程在争抢CPU

减少上下文切换

  • 无锁并发编程,多线程竞争锁的时候会引起上下文的切换,可以使用一些办法避免使用锁,如将数据的ID按照Hash算法取模分段,不同线程处理不同分段的数据。
  • CAS算法,Java的Atomic中使用CAS算法来更新数据,不需要加锁。
  • 使用最少线程,避免创建过多的不需要的线程,会造成大量等待状态的线程
  • 协程,在单线程里实现多任务的调度,并在单线程中维持多个任务之间的切换。

参考:

https://www.jianshu.com/p/1c80cd47e8cf

https://www.cnblogs.com/winclpt/articles/10873024.html

https://www.cnblogs.com/ggjucheng/archive/2012/01/05/2312625.html

以上是关于CPU上下文切换的主要内容,如果未能解决你的问题,请参考以下文章

016_多线程

编程中什么叫上下文

什么是多线程中的上下文切换?

多线程上下文切换

python 进程 线程 协程

异步IO