linux内核调度问题分析
Posted 为了维护世界和平_
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了linux内核调度问题分析相关的知识,希望对你有一定的参考价值。
目录
一、调度场景分析
假如内核只有3个线程,线程0创建线程1和线程2.当系统时钟到来时,时钟中断处理函数会检查是否有进程需要调度。当有进程需要调度时,调度器会选择线程1或者线程2。
执行流程:start_kernel运行在线程0里,线程0创建线程1和线程2。函数调用关系start_kernel()->kernel_debug()->do_fork 创建新线程,并把新线程添加到调度器的就绪队列中。线程0创建线程1和线程2后,进入while线程,线程0不会退出,等待被调度出去。
1、产生时钟中断。处理器采用定时器来周期性地执行。调度器利用时钟中断来定时检测当前运行的线程是否需要调度。当需要调度时,设置need_resched标志位
2、当时钟中断返回,根据linux内核是否支持内核抢占来确定是否需要调度:
不支持内核抢占的内核
不会检查是否调度。即使线程0的need_resched标志位置位了,linux内核也不会调度线程1或者线程2。只有发生在用户态的中断返回或者系统调用返回用户空间时,才会检查是否需要调度。
1)发生时钟中断。触发时钟中断时 当前进程有可能在用户态执行,也可能在内核态执行。
如果进程运行在用户态发生了中断,那么会进入异常向量表的el0_irq汇编函数;
如果进程运行在内核态时发生了中断,会进入异常向量表的el1_irq汇编函数中。
进入中断时,CPU会自动关闭中断。
2)在el1_irq汇编函数里,首先会保存中断现场到当前进程的栈中,使用pt_regs数据结构来实现pt_regs栈,保存中断现场。
中断处理程序过程包括切换到linux内核中断栈、硬件中断号的查询、中断服务程序处理等
3)当确定中断源时时钟中断后,scheduler_tick()函数会检查当前进程是否需要调度。如果需要调度,设置当前进程need_resched标志位(TIF_NEED_RESCHED),
4)中断返回。这里需要给中断控制器返回一个中断结束信号
5)在el1_irq汇编函数恢复中断现场。2)的对应操作
在不支持内核抢占的系统里,汇编函数不会检查是否需要调度。在返回时,CPU打开中断,然后从中断的地方继续执行线程0
支持内核抢占
1)中断返回会检查当前进程是否设置了need_resched表示位,如果置位,调用preempt_schedule_irq函数以调度其他进程并运行。
2)在el1_irq汇编函数即将返回中断现场时,判断当前进程是否需要调度。如果需要调度,调度器会选择下一个进程,并且进行进程的切换。
3)如果选择现场1,则从线程1的pt_regs中恢复中断现场并打开中断,然后继续执行内核线程1的代码。
二、如何让新进程执行
如果线程1是新创建的,它的栈应该是空的,第一次运行时如何恢复中断现场呢?如果不能从线程1的栈中恢复中断现场,那是不是线程1一直在关闭中断的状态下运行?
对于内核线程来说,在创建时会对如下两部分内容进行设置与保存。copy_thread()函数
- 进程的硬件上下文。保存在进程的cpu_context数据结构。
- pt_regs
int copy_thread_tls(unsigned long clone_flags, unsigned long stack_start,
unsigned long stk_sz, struct task_struct *p, unsigned long tls)
else
memset(childregs, 0, sizeof(struct pt_regs));
childregs->pstate = PSR_MODE_EL1h;//5 处理器状态 第0位 栈指针选择符,1:选择栈之战寄存器SP_EL1 2:3 异常级别,值1表示异常级别1
if (IS_ENABLED(CONFIG_ARM64_UAO) &&
cpus_have_const_cap(ARM64_HAS_UAO))
childregs->pstate |= PSR_UAO_BIT;
if (arm64_get_ssbd_state() == ARM64_SSBD_FORCE_DISABLE)
set_ssbs_bit(childregs);
if (system_uses_irq_prio_masking())
childregs->pmr_save = GIC_PRIO_IRQON;
p->thread.cpu_context.x19 = stack_start;//函数地址,用来创建内核线程的函数kernel_thread的第一参数
p->thread.cpu_context.x20 = stk_sz;//参数 ,用来创建内核线程的函数kernel_thread的第二参数
p->thread.cpu_context.pc = (unsigned long)ret_from_fork;//子进程的程序计数器,调度入口
p->thread.cpu_context.sp = (unsigned long)childregs;//sp指向内核栈底部pt_regs起始位置
stack_start指向内核线程的回调函数
x20 指向回调函数的参数
PC寄存器 ret_from_fork 执行入口
三、调度的本质
系统中有一个用户进程A和一个内核线程B,在不考虑自愿调度和系统调用情况下,请描述这两个进程是如何相互切换并运行的。
- 进程A在用户空间运行;
- 发生中断
- CPU打断正在运行的用户进程A,处于异常模式。CPU会跳转到异常向量表的el0_irq里。在汇编函数el0_irq中,首先把中断现场保存到进程A的pt_regs栈
- 处理中断
- 调度滴答处理函数,返回el0_irq汇编函数里。即将返回现场前,ret_to_user汇编函数会检查当前进程是否需要调度。
- 若当前进程需要调度,调用schedule()函数选择下一个进程并切换 ;(switch_to函数)
- 切换函数返回,CPU开始运行内核线程B;进程需要为前一个进程做收尾工作,比如调用raw_spin_unlock_irq来释放锁并打开本地中断。见finish_task_switch函数。
- CPU沿着内核线程B保存的栈帧回溯,一直返回。返回路径finish_task_switch->el1_preempt->el1_irq
- 在el1_irq汇编函数里把上一次发生中断时保存在栈里的中断现场进行恢复,最后从上一次中断的地方开始执行内核线程B的代码。
以上涉及两个上下文切换,中断上下文(pt_regs),进程上下文(task_struct)
以上是关于linux内核调度问题分析的主要内容,如果未能解决你的问题,请参考以下文章