Linux进程控制-2

Posted 王大可~

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux进程控制-2相关的知识,希望对你有一定的参考价值。

紧接着上篇博客出发,我们接着来讲述Linux中进程控制的内容。

目录

1.等待

1.1具体操作

1.等待

进程等待主要的作用在于:父进程创建子进程之后,等待子进程退出,获取子进程的退出码,释放子进程的资源,避免僵尸进程的出现。

1.1具体操作

我们来看两个系统调用接口:

pid_t wait(int *status);

wait是一个阻塞接口,功能是等待当前调用者的任意一个子进程退出,获取返回值,释放资源。其中,status是一个int空间的地址,用于向指定空间中存放子进程的推出返回值。(值得注意的是,wait接口只针对一个子进程,不可面向多个。)

对于wait的返回值:成功则返回处理退出的子进程pid,失败则返回-1。

另外,阻塞接口的概念第一次出现在本专栏中,我们趁机对其进行一个简要的解释。

  • 阻塞接口:为了完成一个功能发起了一个调用,但该调用完成条件不具备,则接口一直等待不返回;
  • 非阻塞接口:为了完成一个功能发起了一个调用,但是该调用完成条件不具备,则立即返回并报错。
pid_t waitpid(pid_t pid, int *status, int options);

waitpid接口,既可以等待任意一个子进程退出,也可以等待指定的子进程退出。其中,pid参数:>0-则表示等待指定pid的子进程退出;-1-则表示等待任意一个子进程退出。

waitpid接口既可以阻带等待,也可以使用非阻塞等待。options参数:0-表示默认阻塞等待;WNOHANG-设施为非阻塞等待(当前没有子进程退出则会报错)。

对于waitpid返回值:成功则返回处理退出的子进程pid;若没有子进程退出则返回0;出错返回-1.

对于阻塞操作和非阻塞操作,阻塞操作通常流程相较简单,但资源利用率也相较低下,这是由于阻塞接口等待参数时并不做任何的其他操作,仅是等待调用条件完备;

而非阻塞操作流程相对复杂,但是资源利用率高,因为对于非阻塞接口而言,我们通常会加入循环操作来对调用条件进行多次判断,所以流程相较繁琐,但是在调用资源不完备的情况下,不会占用资源,阻碍其他接口对资源的使用。

 

我们对wait接口进行一次实践,我们可以很清晰的看出阻塞接口的特性,即等待调用条件完备在执行,若调用条件一直不完备,则一直等待。并且对于wait的功能,我们也能很明了的看出,对于子进程的退出状况。

值得注意的是,当程序正常退出时,即通过return或exit退出,都会设置有相应的退出码,但是如果程序时运行中产生异常崩溃,则设置的退出码也就没了意义。

所以我们需要对程序的是否异常退出加以控制,即我们需要从status中提取判断进程是否正常退出的关键信息,和相对应的退出码。

此时,我们就需要了解一下status中每一个比特位的具体设置,status作为整形数据,由32位比特位构成,其中高16位我们先不关心,对于低16位中的高8位存储的是保存进程退出码,接下来1位作为coredump标志位,剩余7位是信号异常值。

所以当我们判断进程是否正常退出和如何从status中取出退出码,前者可以取status中的低7位(信号异常值)来判断(status & 0x7f),后者则取出低16位中的高8位(进程退出码)((status >> 8) & 0xff) 。

Linux进程控制

进程控制

一、进程创建

fork函数

在linux中fork函数时非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。
其中,fork创建子进程是以父进程为“模板”的。一个父进程可以创建出多个子进程。父:子=1:n,任何孩子都需要知道父亲,父亲需要去标识孩子。


返回值:子进程中返回0,父进程返回子进程id,出错返回-1

进程调用fork,当控制转移到内核中的fork代码后,内核做:

1.分配新的内存块和内核数据结构给子进程
2.将父进程部分数据结构内容拷贝至子进程
3.添加子进程到系统进程列表当中
4.fork返回,开始调度器调度


当一个进程调用fork之后,就有两个二进制代码相同的进程。而且它们都运行到相同的地方。

fork函数返回值

子进程返回0,
父进程返回的是子进程的pid。

写时拷贝

通常,父子代码共享,父子再不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副本,其中代码是共享的且不可被修改,如果各自私有就浪费空间。
数据为什么要私有一份呢?
因为进程之间具有独立性,一个进程在运行期间不会影响另一个进程。
数据很多,不是所有的数据都要立马使用,且不是所有的数据都需要进行拷贝。但是如果立马要独立,就需要将数据全部拷贝,把本来可以在后面拷贝的,甚至不需要拷贝的数据,都拷贝了,就比较浪费时间和空间。
在这个过程中,拷贝不是立马做的!这叫写时拷贝。(如果父子进程只对数据进行读取,则不需要拷贝)。写时拷贝就是改变了页表与物理地址的映射关系。

这样做,写时拷贝可以节省空间和时间,减少浪费。
数据10M,写入的时候1M,发生写时拷贝,是10M还是1M?
答案是1M,因为操作系统会尽力的节省空间。写多少就拷多少。

fork常规用法

一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子 进程来处理请求。

一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数。

总结:如何理解子进程创建?该如何理解fork?
子进程创建本质是系统多了一个进程,子进程
要以父进程为模板。

fork调用失败的原因

系统中有太多的进程
实际用户的进程数超过了限制

二、进程终止

进程退出场景

代码运行完毕,结果正确
代码运行完毕,结果不正确
代码异常终止

main函数退出的时候,返回的数字叫做进程的退出码!
一般正常进程退出的话都返回0,代表正常退出。
非零代表错误,每个数字都代表一种原因。但发生异常情况的话就没有意义了。

进程常见退出方法

正常终止(可以通过 echo $? 查看进程退出码):

  1. 从main返回
  2. 调用exit
  3. _exit

exit:终止整个进程,任何地方调用都会终止
return:叫做终止函数。mian return,表示进程提出

异常退出:
ctrl + c,信号终止

_exit函数

exit函数


exit最后也会调用exit, 但在调用exit之前,还做了其他工作:

  1. 执行用户通过 atexit或on_exit定义的清理函数。
  2. 关闭所有打开的流,所有的缓存数据均被写入
  3. 调用_exit

return退出

return是一种更常见的退出进程方法。执行return n等同于执行exit(n),因为调用main的运行时函数会将main的返回值当做 exit的参数。

三、进程等待

进程等待必要性

之前讲过,子进程退出,父进程如果不管不顾,就可能造成‘僵尸进程’的问题,进而造成内存泄漏。

另外,进程一旦变成僵尸状态,那就刀枪不入,“杀人不眨眼”的kill -9 也无能为力,因为谁也没有办法杀死一个已经死去的进程。

最后,父进程派给子进程的任务完成的如何,我们需要知道。如,子进程运行完成,结果对还是不对,或者是否正常退出。

父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息。

子进程被创建出来,谁先运行,是由调度器说了算的。
那么谁先退出呢?一般而言,我们通常让子进程先退出。

为什么?因为父进程可以很容易对子进程进行管理(垃圾回收)。处理业务,需要让父进程帮我们拿到子进程执行的结果。

一般子进程是需要被等待的,被父进程等,wait/waitpid

进程等待的方法

wait方法

waitpid方法

status :是一个整形指针,其实在传参的时候,该参数是一个输出型参数!

int st = 0;
waitpid(pid, &st,0); //开始等待,子进程退出,操作系统就会从进程PCB中读取退出信息,保存在status只想的变量中。

返回之后,st 中就保存的是我们进程退出的信息,int是32bit,是否正常运行,退出吗是多少,退出信号是多少。

如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并且释放资源,获得子进程退出信息。

如果在任意时刻调用wait/waitpid,子进程存在且正常运行,则进程可能阻塞。

如果不存在该子进程,则立即出错返回。

获取子进程status

wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。

如果传递NULL,表示不关心子进程的退出状态信息。

否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。

status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特
):

总结wait

是什么?是父进程通过wait等系统调用,用来等待子进程状态的一种现象,必须的
为什么?1。防止进程变成僵尸状态,进而产生内存泄漏2.读取子进程状态
怎么办?wait/waitpid,status(signal,exit code)。

四、进程程序替换

替换原理

fork创建子进程:
1.想让子进程执行父进程代码的一部分(富二代子承父业)
2.想让子进程执行做其他和父进程不同的事情。(自力更生)

用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。

进程替换后,有没有创建出新的进程?
不算创建了新的进程,因为PCB没有被重新创建,PID没有被重新生成。

替换函数

其实有六种以exec开头的函数,统称exec函数:

这些调用中,第一个参数代表谁要执行谁。

看下面这段代码:

执行的结果为前面一个printf执行而后面的printf不执行。

原因为该函数一旦替换成功,接下来就开始执行ls的代码了,后面的代码就直接被替换了。

exec系列函数,还没有返回值的!!!
如果有返回值的话一定是程序替换错了。

exec系列函数能调用系统程序,能调用自己的程序吗??

可以的。

makefile默认只生成一个可执行程序,默认是自顶向下扫描makefile文件遇到的第一个目标

make bin,默认就生成谁

函数解释

这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回。

如果调用出错则返回-1

所以exec函数只有出错的返回值而没有成功的返回值。

命名理解

这些函数原型看起来很容易混,但只要掌握了规律就很好记。

l(list) : 表示参数采用列表
v(vector) : 参数用数组
p(path) : 有p自动搜索环境变量PATH
e(env) : 表示自己维护环境变量

这里可以总结出规律:
若函数名中有l,则表示参数格式是列表。
若函数名中有p,则表示该函数调用中带路径。
若函数名中有e,则表示当前函数须自己组装环境变量。

只有execve是系统调用,其他的函数都是对它的封装。

一般exel*函数,我们不会自己调用,一般是fork,让子进程调用,父进程只需要wait就行,一旦命令本身有问题,就不会波及父进程。

以上是关于Linux进程控制-2的主要内容,如果未能解决你的问题,请参考以下文章

linux运维 ps命令

linux运维基础篇 unit8

运维程序简单的命令控制器(支持定时命令执行重复定时任务命令和进程管理,开发这个小程序主要是为了方便管理服务进程)个人github项目

linux云自动化运维基础知识21(selinux的初级管理)

Linux中的进程管理

架构师成长系列|Linux运维工具—系统监控工具htop(1.1