Hello Linux进程概念

Posted 2023-03-07 学习同学

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Hello Linux进程概念相关的知识，希望对你有一定的参考价值。

作者：@小萌新
专栏：@Linux
作者简介：大二学生希望能和大家一起进步！
本篇博客简介：简单介绍下进程的概念

进程

基本概念
PCB 程序控制块
- task_struct是什么
- task_struct里面有什么
查看进程
- 通过系统目录查看进程
- 通过ps指令查看
获取程序的pid和ppid
通过fork函数创建进程
- 如何理解fork创建的子进程
- 如何让父子进程做不同的事
进程的状态
僵尸进程
- 僵尸进程的危害
孤儿进程

基本概念

在操作系统的书本上一般这样子解释一个进程

进程(Process):是操作系统进行资源分配的最小单位。一个进程是一个程序的一次执行过程。

可是这到底是什么意思呢？

进程和程序又有什么区别呢？

下面我们先用一张图来解释进程和程序的区别

我们可以看到程序首先以文件的形式保存在磁盘当中我们双击之后加载到了内存中由cpu加载开始运行

这个进程被加载到内存之后我们可以看到除了原本的代码之外还多了一堆的数据

还记得我们之前的说操作系统是怎么管理的嘛？ 先描述再组织

这一堆多出来的数据就是操作系统对于进程的描述而我们将这一堆数据称为PCB（Process Control Block）程序控制块

那么到这里就可以回答上面的问题的

进程等于程序加上PCB

PCB 程序控制块

我们上面讲过 PCB是操作系统对于进程的描述

当我们使用ps指令的时候我们可以看到系统中存在着大量的进程

同样的每个进程都对应着一个PCB

我们可以这样理解

每个PCB对应着一个进程的数据它们之间使用双链表组织起来我们可以通过PCB来找到并管理每个进程

这样子我们就把操作系统对于进程的管理转化为了对于双链表的增删查改

task_struct是什么

进程控制块（PCB）的作用是描述进程的而Linux系统是使用c语言写出来的

我们在c语言中一般是使用一个结构体去描述一个对象这个在linux描述进程的结构体我们就把它叫做 task_struct

task_struct和PCB的关系就像是你和程序员 task_struct是PCB

task_struct一般会被储存在内存中

task_struct里面有什么

task_struct里面包含以下信息

标示符： 描述本进程的唯一标示符用来区别其他进程

我们可以将它理解为学号

状态： 任务状态退出代码退出信号等

我们可以将这个理解为正常上学休学中等等

优先级： 相对于其他进程的优先级
程序计数器(pc)： 程序中即将被执行的下一条指令的地址
内存指针： 包括程序代码和进程相关数据的指针还有和其他进程共享的内存块的指针
上下文数据： 进程执行时处理器的寄存器中的数据

上下文数据的概念十分重要下面我会使用一个小故事来帮助理解
假设你们现在学校有几个征兵名额你被选上了可以去当一年的兵然后回来继续学业那你能直接过去然后一年后直接回来嘛？显然是不可以的如果这样子做你会发现一年后你被勒令退学了为什么呢？因为你事先没有给学校打招呼啊学校以为你旷课旷了一整年所以说你需要先向学校报备下情况之后才能去服役这样子回来才能够继续学业这就是上下文信息

I/O状态信息： 包括显示的I/O请求分配给进程的I/O设备和被进程使用的文件列表
记账信息： 可能包括处理器时间总和使用的时钟总和时间限制记账号等

因为cpu执行进程的时候要保证尽量的公平一个进程执行了很久了那么就需要提高另外一个进程的优先级那么执行多久这个信息保存在哪里呢？就是在 task_struct 中的记账信息中

其他信息

查看进程

我们可以通过两种方式来查看进程

通过系统目录查看
通过ps指令查看

通过系统目录查看进程

我们在根目录下可以找到一个叫做proc的目录

这个目录中含有大量的进程信息

我们可以发现这些文件中有些是用数字表示的

而这些数字实际上就是程序的pid

如果我们想要查看这些进程的信息只需要进入里面就好了

通过ps指令查看

我们可以通过ps指令去查看进程

但是我们一般查看进程的时候使用的是这样子的语句

ps axj | head -1 && ps axj | grep 66

这段命令分为两部分

&& 连接的两个命令如果前面执行成功了就会执行后面的语句

ps axj | head -1

这段命令的意思打出 ps axj的第一行

 ps axj | grep 66

这段命令的意思是打出所有包含66的进程

获取程序的pid和ppid

pid ： pid是程序的标识符
ppid： ppid是当前进程的父进程的标识符

我们可以写出一段代码来实验下

其中getpid() 的程序存放在 unistd.h 头文件里面

之后我们写好这段代码的makefile文件

之后使用make命令生成可执行程序

运行之后我们就可以发现该进程在循环打印子进程和父进程的pid

通过fork函数创建进程

fork是一个系统调用级别的函数其功能就是创建一个子进程

我们可以通过如下的代码来验证它

我们的代码中只写了一行打印子进程和父进程的代码

make之后看看执行结果

我们可以发现明明只有一行代码而这个代码却执行了两次

并且如果仔细观察我们还能发现这样子的规律

一个进程的pid是另外一个进程的ppid 这就是fork的作用

如何理解fork创建的子进程

从创建层面不论是使用指令跑代码还是使用fork创建进程在操作系统眼中都没有区别
从继承层面 fork出来的子进程它本身没有代码和数据所以说它是拷贝的父进程的代码和数据

那么代码和数据是全部拷贝过来吗？

对于代码来说是的但是一般创建进程之前的代码是用不到的因为已经运行到创建进程结束了

对于数据来说父子进程的数据也就是PCB大部分是共享的但是我们也要考虑修改的情况

因为进程相对来说具有独立性比如说我们想让父进程返回一个10 子进程返回一个20 如果说他们完全共享一个PCB是无法做到的

这里就要用到一个写时拷贝的技术

如何让父子进程做不同的事

父子进程是共享同一段代码的也就是说他们能做的事情是相同的

但是如果它们只能做相同的事情我们只需要使用循环语句就好了根本没有必要大费周章来书写一个子进程

事实上我们可以通过一个叫做pid的返回值来区分父子进程从而达到同时进行两个任务的目的

fork函数的返回值：

我们上面说过了fork是一个函数既然是函数那么他就有返回值

而fork的返回值是这样子的

如果子进程创建失败返回-1
如果子进程创建成功在父进程中返回子进程的pid 在子进程中返回0

那么我们就可以利用这个返回值让父子进程做不同的事情

我们可以发现这是个if else语句

执行之后我们可以发现如下的结果

我们发现竟然if else两个语句都执行了

这就是两个进程同时运行的结果

在做业务的时候我们可以将里面的代码换成业务逻辑就可以了

进程的状态

在进程从创建到消亡的这段时间会存在不同的状态这些状态值储存在PCB当中操作系统会根据PCB中的状态值来决定这个进程是否该运行了是否该结束了

一般来说常见的进程状态有以下几点

在我们的linux源码中对于状态有着如下的定义

/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char *task_state_array[] = 
	"R (running)",       /*  0*/
    "S (sleeping)",      /*  1*/
    "D (disk sleep)",    /*  2*/
    "T (stopped)",       /*  4*/
    "T (tracing stop)",  /*  8*/
    "Z (zombie)",        /* 16*/
    "X (dead)"           /* 32*/
;