第一次作业:Linux2.6源码分析进程模型

Posted 星河天悬

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第一次作业:Linux2.6源码分析进程模型相关的知识,希望对你有一定的参考价值。

1.进程的定义

 从系统允许多个程序同时进入CPU那一天开始,我们才有了进程,进程的出现,解决了程序并发执行时对系统资源共享的描述问题,同时顺路解决了程序执行时动态特征的描述问题。

进程:一个具有一定独立功能的程序关于某个数据集合的一次运行活动,是系统进行资源分配和调度运行的基本单位

进程四要素:

    1.有一段程序供其执行,该程序不一定是一个进程独享,也可以和其他进程共享。

    2.有进程专用的内核空间堆栈。

    3.在内核中有一个名为“进程控制块”的task_struct,内核通过结构对进程进行调度控制。

    4.有独立的用户空间。有独立的用户空间的是进程,有共享的用户空间的是用户线程,没有用户空间的是内核线程。

2.操作系统是怎么组织进程的

 进程控制块PCB(Process Control Block)是进程存在和运行的唯一标志,在Linux中用task_struct这个结构体来表示。这个结构体中有很多数据项。

2.1进程状态

task_struct中用一个长整形state volatile long state; 表示进程的状态。

在linux中有四种基本的进程状态:

(1)就绪态(TASK_RUNNING):包括了运行态的进程。这是为了方便管理,因为任意时刻处于就绪态的进程最多只有一个。

(2)等待(睡眠)态:又被分为两种

      i.浅度睡眠态(TASK_INTERRUPTIBLE): 在两种情况下被唤醒:

                                                         1.当等待的资源满足时。

                                                         2.其它进程通过信号或时钟中断唤醒。

     ii.深度睡眠态(TASK_UNINTERRUPTIBLE):只能等到等待的资源满足时才被唤醒,而不能被其它进程唤醒

 (3)暂停状态(TASK_STOPPED):收到以下几种信号,进程进入暂停状态:

        i.SIGSTOP------------------停止进程执行

        ii。SIGTSTP-----------------从终端发来信号停止进程

       iii。SIGTTIN------------------来自键盘的中断

       iv。SIGTTOU----------------后台进程请求输出。

(4)僵死状态(TASK_ZOMBIE):进程已结束且释放大部分资源,但尚未释放其PCB

2.2进程标识符

每个进程都有一个非负的唯一进程ID(PID)。虽然是唯一的,但是PID可以重用,当一个进程终止后,其他进程就可以使用它的PID了。
PID为0的进程为调度进程,该进程是内核的一部分,也称为系统进程;PID为1的进程为init进程,它是一个普通的用户进程,但是以超级用户特权运行;PID为2的进程是页守护进程,负责支持虚拟存储系统的分页操作。
linux用一个32位无符号整形pid来简单的标识一个进程,用uid和gid分别来标识进程所属的用户和组 pid_t pid; uid_t uid; gid_t gid;  。
2.3内核堆栈
 进程通过alloc_thread_info函数分配它的内核栈,通过free_thread_info函数释放所分配的内核栈.  void*stack; 
 
2.4进程链表
每个task_struct中都有一个tasks的域来连接到进程链表上去。
struct task_struct{  
  ...  
  struct list_head tasks;  
  ...  
  char comm[TASK_COMM_LEN];//可执行程序名  
  ...  
};  

2.5哈希表

进程链表是将所有的进程连接到一个链表上去,所以查找一个进程的时间复杂度是O(N),效率很低。为此,使用哈希表来提高查找的效率。

哈希表的定义 static struct hlist_head *pid_hash;  
哈希函数对查找至关重要,好的哈希函数能减少冲突发生概率。
#define pid_hashfn(nr, ns)      \\  
        hash_long((unsigned long)nr + (unsigned long)ns, pidhash_shift)  
#define hash_long(val, bits) hash_32(val, bits)
static inline u32 hash_32(u32 val, unsigned int bits)  
{  
        /* On some cpus multiply is faster, on others gcc will do shifts */  
        u32 hash = val * GOLDEN_RATIO_PRIME_32;  
  
        /* High bits are more random, so use them. */  
        return hash >> (32 - bits);  
}  
/* 2^31 + 2^29 - 2^25 + 2^22 - 2^19 - 2^16 + 1 */  
#define GOLDEN_RATIO_PRIME_32 0x9e370001UL  

2.6就绪队列

task_struct定义了一个连接到就绪队列的域run_list,同样,内核中有一个就绪队列头runqueue_head。

struct sched_rt_entity {  
        struct list_head run_list;  
        ....  
};  
struct task_struct  
{   
        ....  
        struct sched_rt_entity rt;  
        ......  
};  

2.7等待队列

等待队列的数据结构:
typedef struct __wait_queue wait_queue_t;  
struct __wait_queue {  
        unsigned int flags;  
#define WQ_FLAG_EXCLUSIVE       0x01  
        void *private;  
        wait_queue_func_t func;  
        struct list_head task_list;  
};  

等待队列列头:

struct __wait_queue_head {  
        spinlock_t lock;  
        struct list_head task_list;  
};  
typedef struct __wait_queue_head wait_queue_head_t;  

3.进程状态如何转换

在第二条中已经将进程状态做了分类,详细转换看大佬画的下图。

下附一张自己画的简图

4.进程是如何调度的

4.1进程调度优先级:

 intprio, static_prio, normal_prio;

    unsignedint rt_priority;

    conststruct sched_class *sched_class;

    structsched_entity se;

    structsched_rt_entity rt;

   

4.2优先级定义:

 #defineMAX_USER_RT_PRIO     100

    #defineMAX_RT_PRIO      MAX_USER_RT_PRIO

    #defineMAX_PRIO     (MAX_RT_PRIO+ 40)

    #defineDEFAULT_PRIO     (MAX_RT_PRIO + 20)

 实时优先级范围是0到MAX_RT_PRIO-1(即99),而普通进程的静态优先级范围是从MAX_RT_PRIO到MAX_PRIO-1(即100到139)。值越大静态优先级越低。

4.3调度策略:

 #defineSCHED_NORMAL     0

    #defineSCHED_FIFO       1

    #defineSCHED_RR     2

    #defineSCHED_BATCH      3

    /* SCHED_ISO:reserved but not implemented yet */

    #defineSCHED_IDLE       5

    /* Canbe ORed in to make sure the process is reverted back to SCHED_NORMAL on fork */

    #defineSCHED_RESET_ON_FORK     0x40000000

    SCHED_NORMAL用于普通进程,通过CFS调度器实现。

    SCHED_BATCH用于非交互的处理器消耗型进程。

    SCHED_IDLE是在系统负载很低时使用。

    SCHED_FIFO:先入先出调度算法。

    SCHED_RR:时间片轮流调度算法。

 4.4调度时机

主动式:

    当进程等待资源停止运行的时候,会处于睡眠状态,这时候直接调用schedule()请求调度,让出cpu。

    例:

 current->state= TASK_INTERRUPTIBLE

    schedule();

    使用指向当前进程状态的指针,将state改为可中断睡眠状态,然后调用schedule(),这样cpu就会调度其他资源执行。

抢占式调度:

    首先,抢占的含义,当我们一个进程A在执行的时候,B进程在执行一项更加重要的任务,这时候就需要把cpu的资源让给B,如果A不能像上面一样主动地让出,那么B就去抢占cpu的资源。

4.5调度步骤

    第一步:清理当前运行中的进程的一些资源。

    第二步:根据调度策略选择一个运行的进程。

    第三步:设置新的进程运行环境,例如堆栈,sp等。

    第四步:进程上下文切换,退出A,切到B。

 5.自己对该操作系统进程模型的看法

虽然现在Linux已经是4.x时代了,但是2.6时代的跨度很大,要详细研究问题挺多的。自知才疏学浅,只粗略的学习了其进程模型,觉得其调度器的更改是一个很大改进。
Linux 一开始,普通进程和实时进程都是基于优先级的一个调度器, 实时进程支持 100 个优先级,普通进程是优先级小于实时进程的一个静态优先级,所有普通进程创建时都是默认此优先级,但可通过 nice() 接口调整动态优先级(共40个). 实时进程的调度器比较简单,而普通进程的调度器,则历经变迁。2.6 时代开始支持(2002年引入)O(1) 调度器。顾名思义,此调度器为O(1)时间复杂度。该调度器修正之前的O(n) 时间复杂度调度器,以解决扩展性问题。为每一个动态优先级维护队列,从而能在常数时间内选举下一个进程来执行。

6.参考资料:

https://blog.csdn.net/deep_l_zh/article/details/48346287

https://www.cnblogs.com/jacklu/p/5317406.html

https://blog.csdn.net/kklvsports/article/details/52268085

 https://www.zhihu.com/question/35484429

 

以上是关于第一次作业:Linux2.6源码分析进程模型的主要内容,如果未能解决你的问题,请参考以下文章

第一次作业:基于Linux2.6.30进程模型分析

第一次作业:深入源码分析进程模型(Linux kernel 2.6.32)

第一次作业:基于Linux系统深入源码分析进程模型

第一次作业:深入源码分析进程模型

第一次作业:基于Linux 2.6 的源码 分析进程模型

第一次作业:Linux 2.6.32的进程模型与调度器分析