Linux进程控制-2

Posted 2023-04-05 王大可～

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Linux进程控制-2相关的知识，希望对你有一定的参考价值。

紧接着上篇博客出发，我们接着来讲述Linux中进程控制的内容。

1.等待

1.1具体操作

1.等待

进程等待主要的作用在于：父进程创建子进程之后，等待子进程退出，获取子进程的退出码，释放子进程的资源，避免僵尸进程的出现。

1.1具体操作

我们来看两个系统调用接口：

pid_t wait(int *status);

wait是一个阻塞接口，功能是等待当前调用者的任意一个子进程退出，获取返回值，释放资源。其中，status是一个int空间的地址，用于向指定空间中存放子进程的推出返回值。（值得注意的是，wait接口只针对一个子进程，不可面向多个。）

对于wait的返回值：成功则返回处理退出的子进程pid，失败则返回-1。

另外，阻塞接口的概念第一次出现在本专栏中，我们趁机对其进行一个简要的解释。

阻塞接口：为了完成一个功能发起了一个调用，但该调用完成条件不具备，则接口一直等待不返回；
非阻塞接口：为了完成一个功能发起了一个调用，但是该调用完成条件不具备，则立即返回并报错。

pid_t waitpid(pid_t pid, int *status, int options);

waitpid接口，既可以等待任意一个子进程退出，也可以等待指定的子进程退出。其中，pid参数：>0-则表示等待指定pid的子进程退出；-1-则表示等待任意一个子进程退出。

waitpid接口既可以阻带等待，也可以使用非阻塞等待。options参数：0-表示默认阻塞等待；WNOHANG-设施为非阻塞等待（当前没有子进程退出则会报错）。

对于waitpid返回值：成功则返回处理退出的子进程pid；若没有子进程退出则返回0；出错返回-1.

对于阻塞操作和非阻塞操作，阻塞操作通常流程相较简单，但资源利用率也相较低下，这是由于阻塞接口等待参数时并不做任何的其他操作，仅是等待调用条件完备；

而非阻塞操作流程相对复杂，但是资源利用率高，因为对于非阻塞接口而言，我们通常会加入循环操作来对调用条件进行多次判断，所以流程相较繁琐，但是在调用资源不完备的情况下，不会占用资源，阻碍其他接口对资源的使用。

我们对wait接口进行一次实践，我们可以很清晰的看出阻塞接口的特性，即等待调用条件完备在执行，若调用条件一直不完备，则一直等待。并且对于wait的功能，我们也能很明了的看出，对于子进程的退出状况。

值得注意的是，当程序正常退出时，即通过return或exit退出，都会设置有相应的退出码，但是如果程序时运行中产生异常崩溃，则设置的退出码也就没了意义。

所以我们需要对程序的是否异常退出加以控制，即我们需要从status中提取判断进程是否正常退出的关键信息，和相对应的退出码。

此时，我们就需要了解一下status中每一个比特位的具体设置，status作为整形数据，由32位比特位构成，其中高16位我们先不关心，对于低16位中的高8位存储的是保存进程退出码，接下来1位作为coredump标志位，剩余7位是信号异常值。

所以当我们判断进程是否正常退出和如何从status中取出退出码，前者可以取status中的低7位（信号异常值）来判断（status & 0x7f)，后者则取出低16位中的高8位（进程退出码）（(status >> 8) & 0xff）。

Linux进程控制

一、进程创建

fork函数

在linux中fork函数时非常重要的函数，它从已存在进程中创建一个新进程。新进程为子进程，而原进程为父进程。
其中，fork创建子进程是以父进程为“模板”的。一个父进程可以创建出多个子进程。父：子=1：n，任何孩子都需要知道父亲，父亲需要去标识孩子。

返回值：子进程中返回0，父进程返回子进程id，出错返回-1

进程调用fork，当控制转移到内核中的fork代码后，内核做：

1.分配新的内存块和内核数据结构给子进程
2.将父进程部分数据结构内容拷贝至子进程
3.添加子进程到系统进程列表当中
4.fork返回，开始调度器调度

当一个进程调用fork之后，就有两个二进制代码相同的进程。而且它们都运行到相同的地方。

fork函数返回值

子进程返回0，
父进程返回的是子进程的pid。

写时拷贝

通常，父子代码共享，父子再不写入时，数据也是共享的，当任意一方试图写入，便以写时拷贝的方式各自一份副本，其中代码是共享的且不可被修改，如果各自私有就浪费空间。
数据为什么要私有一份呢？
因为进程之间具有独立性，一个进程在运行期间不会影响另一个进程。
数据很多，不是所有的数据都要立马使用，且不是所有的数据都需要进行拷贝。但是如果立马要独立，就需要将数据全部拷贝，把本来可以在后面拷贝的，甚至不需要拷贝的数据，都拷贝了，就比较浪费时间和空间。
在这个过程中，拷贝不是立马做的！这叫写时拷贝。（如果父子进程只对数据进行读取，则不需要拷贝）。写时拷贝就是改变了页表与物理地址的映射关系。

这样做，写时拷贝可以节省空间和时间，减少浪费。
数据10M，写入的时候1M，发生写时拷贝，是10M还是1M？
答案是1M,因为操作系统会尽力的节省空间。写多少就拷多少。

fork常规用法

一个父进程希望复制自己，使父子进程同时执行不同的代码段。例如，父进程等待客户端请求，生成子进程来处理请求。

一个进程要执行一个不同的程序。例如子进程从fork返回后，调用exec函数。

总结：如何理解子进程创建？该如何理解fork？
子进程创建本质是系统多了一个进程，子进程
要以父进程为模板。

fork调用失败的原因

系统中有太多的进程
实际用户的进程数超过了限制

二、进程终止

进程退出场景

代码运行完毕，结果正确
代码运行完毕，结果不正确
代码异常终止

main函数退出的时候，返回的数字叫做进程的退出码！
一般正常进程退出的话都返回0，代表正常退出。
非零代表错误，每个数字都代表一种原因。但发生异常情况的话就没有意义了。

进程常见退出方法

正常终止（可以通过 echo $? 查看进程退出码）：

从main返回
调用exit
_exit

exit：终止整个进程，任何地方调用都会终止
return：叫做终止函数。mian return，表示进程提出

异常退出:
ctrl + c，信号终止

_exit函数

exit函数

exit最后也会调用exit, 但在调用exit之前，还做了其他工作：

执行用户通过 atexit或on_exit定义的清理函数。
关闭所有打开的流，所有的缓存数据均被写入
调用_exit

return退出

return是一种更常见的退出进程方法。执行return n等同于执行exit(n),因为调用main的运行时函数会将main的返回值当做 exit的参数。

三、进程等待

进程等待必要性

之前讲过，子进程退出，父进程如果不管不顾，就可能造成‘僵尸进程’的问题，进而造成内存泄漏。

另外，进程一旦变成僵尸状态，那就刀枪不入，“杀人不眨眼”的kill -9 也无能为力，因为谁也没有办法杀死一个已经死去的进程。

最后，父进程派给子进程的任务完成的如何，我们需要知道。如，子进程运行完成，结果对还是不对，或者是否正常退出。

父进程通过进程等待的方式，回收子进程资源，获取子进程退出信息。

子进程被创建出来，谁先运行，是由调度器说了算的。
那么谁先退出呢？一般而言，我们通常让子进程先退出。

为什么？因为父进程可以很容易对子进程进行管理（垃圾回收）。处理业务，需要让父进程帮我们拿到子进程执行的结果。

一般子进程是需要被等待的，被父进程等，wait/waitpid

进程等待的方法

wait方法

waitpid方法

status ：是一个整形指针，其实在传参的时候，该参数是一个输出型参数！

int st = 0;
waitpid(pid, &st,0); //开始等待，子进程退出，操作系统就会从进程PCB中读取退出信息，保存在status只想的变量中。

返回之后，st 中就保存的是我们进程退出的信息，int是32bit，是否正常运行，退出吗是多少，退出信号是多少。

如果子进程已经退出，调用wait/waitpid时，wait/waitpid会立即返回，并且释放资源，获得子进程退出信息。

如果在任意时刻调用wait/waitpid，子进程存在且正常运行，则进程可能阻塞。

如果不存在该子进程，则立即出错返回。

获取子进程status

wait和waitpid，都有一个status参数，该参数是一个输出型参数，由操作系统填充。

如果传递NULL，表示不关心子进程的退出状态信息。

否则，操作系统会根据该参数，将子进程的退出信息反馈给父进程。

status不能简单的当作整形来看待，可以当作位图来看待，具体细节如下图（只研究status低16比特
位）：

总结wait

是什么？是父进程通过wait等系统调用，用来等待子进程状态的一种现象，必须的
为什么？1。防止进程变成僵尸状态，进而产生内存泄漏2.读取子进程状态
怎么办？wait/waitpid，status（signal，exit code）。

四、进程程序替换

替换原理

fork创建子进程：
1.想让子进程执行父进程代码的一部分（富二代子承父业）
2.想让子进程执行做其他和父进程不同的事情。（自力更生）

用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。

进程替换后，有没有创建出新的进程？
不算创建了新的进程，因为PCB没有被重新创建，PID没有被重新生成。

替换函数

其实有六种以exec开头的函数,统称exec函数:

这些调用中，第一个参数代表谁要执行谁。

看下面这段代码：

执行的结果为前面一个printf执行而后面的printf不执行。

原因为该函数一旦替换成功，接下来就开始执行ls的代码了，后面的代码就直接被替换了。

exec系列函数，还没有返回值的！！！
如果有返回值的话一定是程序替换错了。

exec系列函数能调用系统程序，能调用自己的程序吗？？

可以的。

makefile默认只生成一个可执行程序，默认是自顶向下扫描makefile文件遇到的第一个目标

make bin，默认就生成谁

函数解释

这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回。

如果调用出错则返回-1

所以exec函数只有出错的返回值而没有成功的返回值。

命名理解

这些函数原型看起来很容易混,但只要掌握了规律就很好记。

l(list) : 表示参数采用列表
v(vector) : 参数用数组
p(path) : 有p自动搜索环境变量PATH
e(env) : 表示自己维护环境变量

这里可以总结出规律：
若函数名中有l，则表示参数格式是列表。
若函数名中有p，则表示该函数调用中带路径。
若函数名中有e，则表示当前函数须自己组装环境变量。

只有execve是系统调用，其他的函数都是对它的封装。

一般exel*函数，我们不会自己调用，一般是fork，让子进程调用，父进程只需要wait就行，一旦命令本身有问题，就不会波及父进程。

以上是关于Linux进程控制-2的主要内容，如果未能解决你的问题，请参考以下文章

linux运维 ps命令

linux运维基础篇 unit8

运维程序简单的命令控制器（支持定时命令执行重复定时任务命令和进程管理，开发这个小程序主要是为了方便管理服务进程）个人github项目

linux云自动化运维基础知识21（selinux的初级管理）

Linux中的进程管理

架构师成长系列|Linux运维工具—系统监控工具htop（1.1