万字详解Linux系列进程信号

Posted 2022-12-03 山舟

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了万字详解Linux系列进程信号相关的知识，希望对你有一定的参考价值。

文章目录

一、信号简介
二、信号产生
三、信号阻塞
四、内核态和用户态
五、信号处理的完整过程
六、信号捕捉
- sigaction
七、volatile
- 现象1
- 现象2
感谢阅读，如有错误请批评指正

一、信号简介

这部分先对信号做一个整体的介绍，更详细的内容会在后文讲解。

1.查看信号

通过kill -l查看全部的信号。

本文主要讲解普通信号，简单介绍实时信号。

man 7 signal可以查看信号在什么条件下产生、默认的处理动作是什么……

2.信号的本质

上图中的信号本质是一个宏，可以如下查看某个信号对应的宏的值。

上图中有三个头文件中包含了SIGQUIT（其实也包含了全部的信号），下面随便打开一个头文件查看其中的宏（部分宏如下）。

3.信号的记录和发送

信号收到时，不一定要立刻处理，比如当前有更重要的任务要执行，就可以先暂时搁置信号，但是要记录下这个信号需要在未来“合适”的时间处理掉，所以信号需要用一段内容来记录。

信号记录在进程的task_struct（PCB）结构体中，对于普通信号，本质是记录多个信号“是否”产生。由于只有“是”或“否”两种状态，且普通信号编号是1-31，显然用一个位图（这里用无符号整型即可）的32个比特位即可很好的管理（比特位的位置代表是否收到信号，比特位为0代表没有收到了信号，为1则代表收到了信号）。

进程收到信号，本质是位图被修改，只能通过操作系统修改进程内的信号位图（虽然可以通过命令行或代码向某个进程发送信号，但其实还通过了操作系统，所以本质还是操作系统）。

4.从键盘输入的信号

执行如下死循环代码：

#include <stdio.h>
#include <unistd.h>

int main()

	while (1)
	
		printf("hello signal!\\n");
		sleep(1);
	
	return 0;

对于这种死循环的进程，需要从键盘输入Ctrl+C来终止，而这本身也是一种信号。

这里要注意：Shell可以同时运行一个前台进程和任意多个后台进程,只有前台进程才能接到像Ctrl+C这种控制键产生的信号。

在运行进程的命令后加&即可将进程放到后台运行，这时Shell不必等待进程结束就可以接受新的命令，启动新的进程，但是后台进程无法用Ctrl+C结束，可以用kill -3来终止。

上面的动图中，后台进程用Ctrl+C无法终止，这时要通过kill -3再加上后台进程的PID来终止。

5.signal自定义信号

为什么通过Ctrl+C可以终止一个进程呢？它本质还是向进程发送了一个编号为2的SIGINT信号，只不过这个信号是通过键盘输入的，然后经过操作系统处理后再发送给进程。

SIGINT原本是用来结束进程的，但用signal自定义它的功能后就可以使它对进程的效果改变。

下面的代码就通过signal函数自定义了2号信号的功能，我这里是当输入2号信号（Ctrl+C）时打印"new function!"，而系统原来定义的终止进程的功能不再起作用。

#include <signal.h>
#include <stdio.h>
#include <unistd.h>

//handle函数内实现的功能是打印"new function!"
void handle(int sigNum)

	printf("new function! sigNum:%d\\n", sigNum);


int main()

	signal(2, handle);//将2号信号的功能改为handle
	while (1)
	
		printf("a\\n");
		sleep(1);
	
	return 0;

可以看到，每次按下Ctrl+C，都会打印对应内容（实现自定义的功能而不是像原来一样终止进程），而sigNum也证明Ctrl+C对应的信号值确实是2号。

但不是所有的信号都可以被自定义（捕捉）的，比如9号信号SIGKILL。

6.处理信号的一般方式

1.忽略此信号。
2.执行该信号的默认处理动作（系统中已经定义好的）。
3.提供一个信号处理函数（像上面那样自定义的函数），要求内核在处理该信号时切换到用户态执行这个处理函数，这种方式称为捕捉一个信号。

二、信号产生

1.通过终端按键(键盘)产生信号

介绍两个常用的键盘输入产生的信号：Ctrl+C发送2号信号SIGINT、Ctrl+\\发送3号信号SIGQUIT。（注意键盘输入的信号不止这两个，这里只是以这两个为例）

SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且Core Dump。

Core Dump（核心转储）

当一个进程异常终止时，可以把进程的核心数据全部转而储存到磁盘上,文件名通常是core.PID，这一现象叫做Core Dump。

一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存在PCB中)。默认是不允许产生core文件的，因为core文件中可能包含用户密码等敏感信息，泄漏会导致不安全。

如下图中所示云服务器环境中一般不允许产生core文件（core file size的值为0）。

通过ulimit -c修改core file size后，再次用Ctrl+\\发送信号，可以看到进程被终止且产生了core文件。

2.程序异常

程序异常时操作系统会向程序发送信号来终止进程，这一结果可以通过core文件来看到，下面通过用core文件进行事后调试来讲解上述过程。

事后调试

进程异常终止通常是因为有Bug(比如非法内存访问导致段错误)，事后可以用调试器检查core文件以查清错误原因，这叫做Post-mortem Debug（事后调试）。

通过下面的代码（有除零错误）来大致演示通过core文件调试。

#include <stdio.h>
#include <unistd.h>

int main()

	while (1)
	
		sleep(1);
		int a = 1 / 0;//除零错误
	
	return 0;

运行可执行程序及后续调试如下：

可以看到core文件中包含的调试信息非常详细、精准，如果代码量极大，那么core文件会更加快速地调试。

而上面的Floating point exception报错和core中收到的8号信号SIGFPE刚好对应。

3.调用函数

（1）kill函数

mykill.c如下，通过它产生可执行程序kill并传入命令行参数来终止其他进程。

#include <signal.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>

int main(int argc, char* argv[])

	//argv[0]是执行可执行程序
	//argv[1]是进程的pid
	//argv[2]是发送的信号编号
	//argv[3]是NULL
	//argc是有效参数3
	if (argc != 3)
	
		printf("input error!\\n");
		exit(1);
	
	else
	
		pid_t pid = atoi(argv[1]);
		int sigNo = atoi(argv[2]);

		kill(pid, sigNo);
	
	return 0;

mytest.c如下，一个简单的死循环，等待可执行程序kill发送信号将其终止。

#include <signal.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>

int main()

	while (1)
	
		printf("a\\n");
		sleep(1);
	
	return 0;

运行test死循环后用可执行程序kill传入test的pid和信号编号来向test发送信号，注意不是使用的命令行中的kill，而是用的自己实现的可执行程序。

（2）raise函数

raise是自己给自己发送信号，与kill不同。

#include <signal.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>

//处理传入的信号编号
void handler(int signo)

	printf("get a signal : %d\\n", signo);


int main()

	signal(2, handler);//将2号信号自定义

	while (1)
	
		printf("I am a process, pid : %d\\n", getpid());
		sleep(1);
		raise(2);//该进程自己给自己发送2号信号
	
	return 0;

可以看拿到，每次该进程自己向自己发送信号，就输出自定义后的内容。

（3）abort

abort使当前进程接收到信号而异常终止。

#include <signal.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>

void handler(int signo)

	printf("get a signal : %d\\n", signo);


int main()

	signal(6, handler);

	while (1)
	
		printf("I am a process, pid : %d\\n", getpid());
		sleep(1);
		abort();
	
	return 0;

可以看到，运行到abort后收到6号信号，然后程序就终止了；

4.由于软件条件产生信号

（1）SIGPIPE

SIGPIPE就是一种因软件条件产生的信号，在【万字详解Linux系列】进程间通信（IPC）中已经介绍过，这里不多赘述。

（2）SIGALRM

触发SIGALRM信号需要用到alarm函数，函数介绍如下：

函数的返回值是0或是之前设定的闹钟时间还余下的秒数。

#include <signal.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>

int main()

	int count = 0;
	alarm(1);//倒计时1s
	while (1)
	
		printf("count : %d\\n", count++);//看看1s内可以将一个整型值加到多少
	
	return 0;

可以看到1s的定时内，count被加到了17482，之后Alarm clock也说明进程收到了SIGALRM的信号。

5.硬件异常产生信号

发生硬件异常时，它被硬件以某种方式检测到并通知内核，然后内核向当前进程发送适当的信号。

例如当前进程执行了除零的指令，CPU的运算单元会产生异常，内核将这个异常解释为SIGFPE信号，并将该信号发送给进程。
再如当前进程访问了非法内存地址，MMU会产生异常，内核将这个异常解释为SIGSEGV信号，并将该信号发送给进程。

三、信号阻塞

1.相关概念

实际执行信号的处理动作称为信号递达(Delivery)。
信号从产生到递达之间的状态,称为信号未决(Pending)。
进程可以选择阻塞 (Block)某个信号。
被阻塞的信号产生时将保持在未决状态，直到进程解除对此信号的阻塞，才执行递达的动作。

注意：阻塞和忽略是不同的，阻塞本质是不让信号递达（直到解除阻塞），而忽略本质是递达（处理信号）的一种方式。

2.内核中的表示

如上，每个信号都有两个标志位分别表示阻塞(block)和未决(pending)，还有一个函数指针表示处理动作。
信号产生时，内核在进程控制块中设置该信号的未决标志(pending)，直到信号递达才清除该标志。之后如果被阻塞，则直到阻塞结束才处理，否则直接调用handler内的方法处理该信号。

在上图的例子中：

SIGHUP信号未阻塞也未产生过，如果它递达则执行默认处理动作。
SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略，但在没有解除阻塞之前不能忽略这个信号。
SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。

注意：在Linux下如果常规信号在递达之前产生多次则只记最后一次，而实时信号在递达之前产生多次可以依次放在一个队列里。但本篇暂不讨论实时信号。

3.sigset_t

从上图来看，每个信号只有一个比特位的未决标志，非0即1，不记录该信号产生了多少次，阻塞标志同理。
因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储，sigset_t称为信号集，这个类型可以表示每个信号的“有效”或“无效”状态。在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞，而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。

sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些比特位则是与操作系统有关的（所以不能冒然用按位与、按位或来拿到信号，因为操作系统底层不一定是这么实现的）。

从使用者的角度是不必关心的，使用者只能调用下面介绍的函数来操作sigset_ t变量，而不应该对它的内部数据做任何解释，比如用printf直接打印sigset_t，这是毫无意义的。

4.信号集操作函数

（1）对信号集的操作

常用的信号集操作函数有如下五个，各自的大致用法已注释在其后。

#include <signal.h>//头文件

int sigemptyset(sigset_t *set);//初始化set所指向的信号集,使其中所有信号的比特位清零,表示该信号集不包含任何有效信号
int sigfillset(sigset_t *set);//初始化set所指向的信号集,使其中所有信号的对应比特位置为1,表示该信号集的有效信号包括系统支持的所有信号
int sigaddset (sigset_t *set, int signo);//向信号集set中添加编号为signo的信号
int sigdelset(sigset_t *set, int signo);//从信号集set中删除编号为signo的信号
int sigismember（const sigset_t *set, int signo);//判断编号为signo的信号是否在信号集set中

这四个函数都是成功返回0、出错返回-1。sigismember用于判断一个信号集的有效信号中是否包含某种信号，若包含则返回1，不包含则返回0，出错返回-1。

注意，上面五个函数都是系统级别的函数，它们在使用时并不会影响进程的任何信息（不会修改进程的PCB）。

（2）sigpromask

调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集，即上面的block表)。

how有三个选项（下面的式子中假设mask是当前的信号屏蔽字，且这些式子只是帮助理解，不能实际写在代码中）

SIG_BLOCK：这时传入的set包含了希望添加到当前信号屏蔽字（block表）中的信号，可以理解为mask=mask | set。
SIG_UNBLOCK：这时传入的set包含了希望从当前信号屏蔽字（block表）中取消阻塞的信号，可以理解为mask=mask & ~set。
SIG_SETMASK：设置当前的信号屏蔽字为传入的set，相当于mask=set。

set就是传入一个信号集，然后根据how的选项来进行操作。

oset是输出型参数，传入NULL时不做处理，如果传入非空则将原来的信号屏蔽字返回至oset，也就是拿到了修改之前的信号屏蔽字。

三个参数的功能整理如下：

如果oset是非空指针，则当前进程的信号屏蔽字通过oset参数传出。
如果set是非空指针，则更改进程的信号屏蔽字，参数how指示如何更改。
如果oset和set都是非空指针，则先将原来的信号屏蔽字备份到oset里，然后根据set和how参数更改信号屏蔽字。

（3）sigpending

这个函数非常简单，就是获取当前进程的pending位图。

（4）使用函数

下面的代码的大致功能是首先阻塞2号信号SIGINT，然后不断打印pending表（这时应该是全0），当向该进程发送2号信号后会观察到pending表第二位变为1（被阻塞而无法递达）。

#include <stdio.h>
#include <unistd.h>
#include <signal.h>

void printPending(sigset_t *pending)

    //依次打印31个信号
    int i = 1;
    for (i = 1; i <= 31; i++)
    
        //用sigismember判断第i个信号是否存在于pending表中
        if (sigismember(pending, i))
            printf("1");//存在打印1
        else
            printf("0");//不存在打印0
    
    printf("\\n");


int main()

    sigset_t set, oset;

    //初始化
    sigemptyset(&set);
    sigemptyset(&oset);
   
    sigaddset(&set, 2);//将2号信号加入set信号集
    sigprocmask(SIG_SETMASK, &set, &oset);//将2号信号加入信号屏蔽字，并将原来的信号集返回至oset
   
    sigset_t pending;//保存pending表
    while (1)
    
        sigemptyset(&pending);//初始化
        sigpending(&pending);//拿到pending表

        printPending(&pending);//打印pending表
        sleep(1);//每隔一秒打印一次
    
    return 0;

运行如下：

最后通过Ctrl+\\发送信号终止进程成功了，因为这个信号没有被阻塞；但由于Ctrl+C发送的信号被阻塞，所以无法终止进程。

对上面的程序略加修改，使2号信号在阻塞5s后递达给进程，结果是终止进程。

#include <stdio.h>
#include <unistd.h>
#include <signal.h>

void printPending(sigset_t *pending)

    //依次打印31个信号
    int i = 1;
    for (i = 1; i <= 31; i++)
    
        //用sigismember判断第i个信号是否存在于pending表中
        if (sigismember(pending, i))
            printf("1");//存在打印1
        else
            printf("0");//不存在打印0
    
    printf("\\n");


int main()

    sigset_t set, oset;

    //初始化
    sigemptyset(&set);
    sigemptyset(&oset);
   
    sigaddset(&set, 2);//将2号信号加入set信号集
    sigprocmask(SIG_SETMASK, &set, &oset);//将2号信号加入信号屏蔽字，并将原来的信号集返回至oset
   
    sigset_t pending;//保存pending表
    int count = 0;
    while (1)
    
        sigemptyset(&pending);//初始化
        sigpending(&pending);//拿到pending表

        printPending(&pending);//打印pending表
        sleep(1);
        count++;
        if (count >= 5)//5秒后解除阻塞
        
            //恢复刚开始的信号屏蔽字(2号信号被解除阻塞)
            sigprocmask(SIG_SETMASK, &oset, NULL);
            //恢复信号屏蔽字后，2号信号不再被阻塞，而是递达给进程
            //于是进程被终止
        
    
    return 0;

现象如下，打印两次后向进程发送2号信号SIGINT，又打印三次后解除阻塞，信号递达，进程终止。

四、内核态和用户态

进程收到信号后不是立即对其进行处理的，而是在“合适”的时候，这个“合适”的时候指的是从内核态切换回用户态时。那么什么是内核态和用户态，下面进行介绍。

内核态通常执行OS的代码，是一种权限非常高的状态。用户态通常执行普通用户的代码，是一种受监管的普通状态。

五、信号处理的完整过程

了解了上面的相关知识后，就不难理解下面信号处理的完整过程了，具体见下图。

如果忽略收到的信号或是按照默认处理动作处理时，整个过程比较简单（因为没有设计到多次设计状态的切换），而处理自定义的动作叫做信号捕捉，下面讲到的就是信号捕捉。

六、信号捕捉

sigaction

sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0，出错则返回- 1。signo是指定信号的编号。若act指针非空，则根据act修改该信号的处理动作。若oact指针非空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体。
将sa_handler赋值为常数SIG_IGN表示忽略信号，赋值为常数SIG_DFL表示执行系统默认动作，赋值为一个函数指针表示用自定义函数捕捉信号，或者说向内核注册了一个信号处理函数。该函数返回值为void，可以带一个int参数，通过参数可以得知当前信号的编号，这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数，不是被main函数调用，而是被系统所调用。
如果在调用信号处理函数时，除了当前信号被自动屏蔽之外，还希望自动屏蔽另外一些信号，则用sa_mask字段说明这些需要额外屏蔽的信号，当信号处理函数返回时自动恢复原来的信号屏蔽字。 sa_flags字段包含一些选项，后面的代码都把sa_flags设为0；sa_sigaction是实时信号的处理函数，本篇暂不详细解释这两个字段。

当某个信号的处理函数被调用时，内核自动将当前信号加入进程的信号屏蔽字，当信号处理函数返回时自动恢复原来的信号屏蔽字，这样就保证了在处理某个信号时如果这种信号再次产生，那么它会被阻塞到当前处理结束为止。

运行下面的代码：

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <signal.h>

struct sigaction act, oact;//两个传入sigaction的结构体

void handler(int signo)

	printf("get a signal : %d\\n", signo);
	sigaction(SIGINT, &oact, NULL);//将SIGINT的处理动作改为最开始的(系统默认的)


int main()

	//初始化
	memset(&act, 0, sizeof(act));
	memset(&oact, 0, sizeof(oact));
	
	act.sa_handler = handler;//捕捉信号
	act.sa_flags = 0;
	sigemptyset(&act.sa_mask);//初始化

	sigaction(SIGINT, &act, &oact);//传入act修改SIGINT的处理动作

	while (1)
	
		printf("hello world!\\n");
		sleep(1);
	
	return 0;

现象如下：

以上是关于万字详解Linux系列进程信号的主要内容，如果未能解决你的问题，请参考以下文章