Linux - 进程概念

Posted ikun66666

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux - 进程概念相关的知识,希望对你有一定的参考价值。

1.冯诺依曼体系结构

我们常见的计算机,如笔记本。我们不常见的计算机,如服务器,大部分都遵守冯诺依曼体系

截至目前,我们所认识的计算机,都是由一个个的硬件组件组成

● 输入单元:包括键盘, 鼠标,扫描仪, 写板等
● 中央处理器(CPU):含有运算器和控制器等
● 输出单元:显示器,打印机等

关于冯诺依曼,必须强调几点:

● 这里的存储器指的是内存
● 不考虑缓存情况,这里的CPU能且只能对内存进行读写,不能访问外设(输入或输出设备)
● 外设(输入或输出设备)要输入或者输出数据,也只能写入内存或者从内存中读取。
● 一句话,所有设备都只能直接和内存打交道。

对冯诺依曼的理解,不能停留在概念上,要深入到对软件数据流理解上,请解释,从你登录qq开始到和某位朋友聊天开始,数据的流动过程。

2.操作系统(Operator System)

概念:

任何计算机系统都包含一个基本的程序集合,称为操作系统(OS)。笼统的理解,操作系统包括:

● 内核(进程管理,内存管理,文件管理,驱动管理)
● 其他程序(例如函数库,shell程序等等)

设计OS的目的:

● 与硬件交互,管理所有的软硬件资源
● 为用户程序(应用程序)提供一个良好的执行环境

定位:

在整个计算机软硬件架构中,操作系统的定位是: 一款纯正的“搞管理”的软件

如何理解"管理":

总结

计算机管理硬件

1.描述起来,用struct结构体
2.组织起来,用链表或其他高效的数据结构

3.系统调用和库函数概念

在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口,叫做系统调用。

系统调用在使用上,功能比较基础,对用户的要求相对也比较高,所以,有心的开发者可以对部分系统调用进行适度封装,从而形成库,有了库,就很有利于更上层用户或者开发者进行二次开发。

系统调用,其实就是OS设计的C语言函数!

4.进程概念

概念:程序的一个执行实例,正在执行的程序等
内核观点:担当分配系统资源的实体

4.1描述进程-PCB

进程信息被放在一个叫做程序控制块的数据结构中,可以理解为进程属性的集合
Linux操作系统下的PCB是 task_struct

task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含着进程的信息。

task_ struct内容分类

标示符: 描述本进程的唯一标示符,用来区别其他进程。
状态: 任务状态,退出代码,退出信号等。
优先级: 相对于其他进程的优先级。
程序计数器: 程序中即将被执行的下一条指令的地址。
内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
上下文数据: 进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。
I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
其他信息

可以在内核源代码里找到它。所有运行在系统里的进程都以task_struct链表的形式存在内核里。

Linux下的task_struct如下:

//Linux中task_struct用来控制管理进程,结构如下:

struct task_struct

 //说明了该进程是否可以执行,还是可中断等信息
    volatile long state; 
 //Flage 是进程号,在调用fork()时给出
 unsigned long flags; 
 //进程上是否有待处理的信号
 int sigpending;  
 //进程地址空间,区分内核进程与普通进程在内存存放的位置不同
 mm_segment_t addr_limit; //0-0xBFFFFFFF for user-thead 
      //0-0xFFFFFFFF for kernel-thread
                       
 //调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度
 volatile long need_resched;
 //锁深度
 int lock_depth; 
 //进程的基本时间片
 long nice;      

 //进程的调度策略,有三种,实时进程:SCHED_FIFO,SCHED_RR, 分时进程:SCHED_OTHER
 unsigned long policy;
 //进程内存管理信息
 struct mm_struct *mm;
 
 int processor;
 //若进程不在任何CPU上运行, cpus_runnable 的值是0,否则是1 这个值在运行队列被锁时更新
 unsigned long cpus_runnable, cpus_allowed;
 //指向运行队列的指针
 struct list_head run_list;
 //进程的睡眠时间
 unsigned long sleep_time; 

 //用于将系统中所有的进程连成一个双向循环链表, 其根是init_task
 struct task_struct *next_task, *prev_task;
 struct mm_struct *active_mm;
 struct list_head local_pages;       //指向本地页面     
 unsigned int allocation_order, nr_local_pages;
 struct linux_binfmt *binfmt;  //进程所运行的可执行文件的格式
 int exit_code, exit_signal;
 int pdeath_signal;     //父进程终止是向子进程发送的信号
 unsigned long personality;
 //Linux可以运行由其他UNIX操作系统生成的符合iBCS2标准的程序
 int did_exec:1;
 pid_t pid;    //进程标识符,用来代表一个进程
 pid_t pgrp;   //进程组标识,表示进程所属的进程组
 pid_t tty_old_pgrp;  //进程控制终端所在的组标识
 pid_t session;  //进程的会话标识
 pid_t tgid;
 int leader;     //表示进程是否为会话主管
 struct task_struct *p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr;
 struct list_head thread_group;   //线程链表
 struct task_struct *pidhash_next; //用于将进程链入HASH表
 struct task_struct **pidhash_pprev;
 wait_queue_head_t wait_chldexit;  //供wait4()使用
 struct completion *vfork_done;  //供vfork() 使用
 unsigned long rt_priority; //实时优先级,用它计算实时进程调度时的weight值
 //it_real_value,it_real_incr用于REAL定时器,单位为jiffies, 系统根据it_real_value

 //设置定时器的第一个终止时间. 在定时器到期时,向进程发送SIGALRM信号,同时根据

 //it_real_incr重置终止时间,it_prof_value,it_prof_incr用于Profile定时器,单位为jiffies。

 //当进程运行时,不管在何种状态下,每个tick都使it_prof_value值减一,当减到0时,向进程发送

 //信号SIGPROF,并根据it_prof_incr重置时间.
 //it_virt_value,it_virt_value用于Virtual定时器,单位为jiffies。当进程运行时,不管在何种

 //状态下,每个tick都使it_virt_value值减一当减到0时,向进程发送信号SIGVTALRM,根据

 //it_virt_incr重置初值。

 unsigned long it_real_value, it_prof_value, it_virt_value;
 unsigned long it_real_incr, it_prof_incr, it_virt_value;
 struct timer_list real_timer;   //指向实时定时器的指针
 struct tms times;      //记录进程消耗的时间
 unsigned long start_time;  //进程创建的时间

 //记录进程在每个CPU上所消耗的用户态时间和核心态时间
 long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS];
 //内存缺页和交换信息:

 //min_flt, maj_flt累计进程的次缺页数(Copy on Write页和匿名页)和主缺页数(从映射文件或交换

 //设备读入的页面数); nswap记录进程累计换出的页面数,即写到交换设备上的页面数。
 //cmin_flt, cmaj_flt, cnswap记录本进程为祖先的所有子孙进程的累计次缺页数,主缺页数和换出页面数。

 //在父进程回收终止的子进程时,父进程会将子进程的这些信息累计到自己结构的这些域中
 unsigned long min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;
 int swappable:1; //表示进程的虚拟地址空间是否允许换出
 //进程认证信息
 //uid,gid为运行该进程的用户的用户标识符和组标识符,通常是进程创建者的uid,gid

 //euid,egid为有效uid,gid
 //fsuid,fsgid为文件系统uid,gid,这两个ID号通常与有效uid,gid相等,在检查对于文件

 //系统的访问权限时使用他们。
 //suid,sgid为备份uid,gid
 uid_t uid,euid,suid,fsuid;
 gid_t gid,egid,sgid,fsgid;
 int ngroups; //记录进程在多少个用户组中
 gid_t groups[NGROUPS]; //记录进程所在的组

 //进程的权能,分别是有效位集合,继承位集合,允许位集合
 kernel_cap_t cap_effective, cap_inheritable, cap_permitted;

 int keep_capabilities:1;
 struct user_struct *user;
 struct rlimit rlim[RLIM_NLIMITS];  //与进程相关的资源限制信息
 unsigned short used_math;   //是否使用FPU
 char comm[16];   //进程正在运行的可执行文件名
 //文件系统信息
 int link_count, total_link_count;

 //NULL if no tty 进程所在的控制终端,如果不需要控制终端,则该指针为空
 struct tty_struct *tty;
 unsigned int locks;
 //进程间通信信息
 struct sem_undo *semundo;  //进程在信号灯上的所有undo操作
 struct sem_queue *semsleeping; //当进程因为信号灯操作而挂起时,他在该队列中记录等待的操作
 //进程的CPU状态,切换时,要保存到停止进程的task_struct中
 struct thread_struct thread;
   //文件系统信息
 struct fs_struct *fs;
   //打开文件信息
 struct files_struct *files;
   //信号处理函数
 spinlock_t sigmask_lock;
 struct signal_struct *sig; //信号处理函数
 sigset_t blocked;  //进程当前要阻塞的信号,每个信号对应一位
 struct sigpending pending;  //进程上是否有待处理的信号
 unsigned long sas_ss_sp;
 size_t sas_ss_size;
 int (*notifier)(void *priv);
 void *notifier_data;
 sigset_t *notifier_mask;
 u32 parent_exec_id;
 u32 self_exec_id;

 spinlock_t alloc_lock;
 void *journal_info;
 ;

4.2查看进程

进程的信息可以通过 /proc 系统文件夹查看

查看PID为1的进程

ls /proc/1

大多数进程信息同样可以使用top和ps这些用户级工具来获取

ps axj | head -1 && ps axj | grep myprocess | grep -v grep

4.3通过系统调用获取进程标示符

进程id(PID) 父进程id(PPID)

getpid() 获取pid getppid() 获取父进程pid

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()

    while (1)
    
        printf("hello process,我的pid: %d ", getpid());
        printf("我的父进程ppid: %d\\n", getppid());
    

    return 0;
kill -9 pid //终止进程

4.4通过系统调用创建进程-fork初识

运行 man fork 认识fork fork有两个返回值 父子进程代码共享,数据各自开辟空间,私有一份(采用写时拷贝)
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
int main()

    printf("AAAAAAAAAAAA:pid:%d ppid:%d\\n", getpid(), getppid());
    pid_t ret = fork();
    printf("BBBBBBBBBBBB: pid:%d, ppid:%d, ret:%d, &ret:%p\\n", getpid(), getppid(), ret, &ret);
    sleep(1);

    return 0;

发现执行了两个BBBBBBB,父子进程顺序是顺机的,由操作系统决定

这里AAAAAA的父进程其实就是bash

两个问题?

1个函数为什么由两个返回值?
同一个地址,变量有两个值?

fork 之后通常要用 if 进行分流 ret>0的是父进程,ret==0是子进程

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

int main()

    pid_t ret = fork();
    if (ret == 0)
    
        // 子进程
        while (1)
        
            printf("我是子进程,我的pid是:%d,我的父进程是:%d\\n", getpid(), getppid());
            sleep(1);
        
    
    else if (ret > 0)
    
        // 父进程
        while (1)
        
            printf("我是父进程,我的pid是:%d,我的父进程是:%d\\n", getpid(), getppid());
            sleep(2);
        
    
    else
    
    

    return 0;

fork后执行流变成两个执行流,谁先运行由调度器,且代码共享,通常我们用if /elseif来执行流分流。

以上是关于Linux - 进程概念的主要内容,如果未能解决你的问题,请参考以下文章

Linux从青铜到王者第六篇:Linux进程概念第二篇

[OS-Linux]详解Linux的进程1(进程概念PCB进程创建,进程状态,僵尸进程,孤儿进程)

[OS-Linux]详解Linux的进程1(进程概念PCB进程创建,进程状态,僵尸进程,孤儿进程)

:Linux进程概念

Linux进程概念(精讲)

Linux进程概念(精讲)