万字详解Linux系列进程信号
Posted 山舟
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了万字详解Linux系列进程信号相关的知识,希望对你有一定的参考价值。
文章目录
一、信号简介
这部分先对信号做一个整体的介绍,更详细的内容会在后文讲解。
1.查看信号
通过kill -l查看全部的信号。
本文主要讲解普通信号,简单介绍实时信号。
man 7 signal可以查看信号在什么条件下产生、默认的处理动作是什么……
2.信号的本质
上图中的信号本质是一个宏,可以如下查看某个信号对应的宏的值。
上图中有三个头文件中包含了SIGQUIT(其实也包含了全部的信号),下面随便打开一个头文件查看其中的宏(部分宏如下)。
3.信号的记录和发送
信号收到时,不一定要立刻处理,比如当前有更重要的任务要执行,就可以先暂时搁置信号,但是要记录下这个信号需要在未来“合适”的时间处理掉,所以信号需要用一段内容来记录。
信号记录在进程的task_struct(PCB)结构体中,对于普通信号,本质是记录多个信号“是否”产生。由于只有“是”或“否”两种状态,且普通信号编号是1-31,显然用一个位图(这里用无符号整型即可)的32个比特位即可很好的管理(比特位的位置代表是否收到信号,比特位为0代表没有收到了信号,为1则代表收到了信号)。
进程收到信号,本质是位图被修改,只能通过操作系统修改进程内的信号位图(虽然可以通过命令行或代码向某个进程发送信号,但其实还通过了操作系统,所以本质还是操作系统)。
4.从键盘输入的信号
执行如下死循环代码:
#include <stdio.h>
#include <unistd.h>
int main()
while (1)
printf("hello signal!\\n");
sleep(1);
return 0;
对于这种死循环的进程,需要从键盘输入Ctrl+C来终止,而这本身也是一种信号。
这里要注意:Shell可以同时运行一个前台进程和任意多个后台进程,只有前台进程才能接到像Ctrl+C这种控制键产生的信号。
在运行进程的命令后加&即可将进程放到后台运行,这时Shell不必等待进程结束就可以接受新的命令,启动新的进程,但是后台进程无法用Ctrl+C结束,可以用kill -3来终止。
上面的动图中,后台进程用Ctrl+C无法终止,这时要通过kill -3再加上后台进程的PID来终止。
5.signal自定义信号
为什么通过Ctrl+C可以终止一个进程呢?它本质还是向进程发送了一个编号为2的SIGINT信号,只不过这个信号是通过键盘输入的,然后经过操作系统处理后再发送给进程。
SIGINT原本是用来结束进程的,但用signal自定义它的功能后就可以使它对进程的效果改变。
下面的代码就通过signal函数自定义了2号信号的功能,我这里是当输入2号信号(Ctrl+C)时打印"new function!",而系统原来定义的终止进程的功能不再起作用。
#include <signal.h>
#include <stdio.h>
#include <unistd.h>
//handle函数内实现的功能是打印"new function!"
void handle(int sigNum)
printf("new function! sigNum:%d\\n", sigNum);
int main()
signal(2, handle);//将2号信号的功能改为handle
while (1)
printf("a\\n");
sleep(1);
return 0;
可以看到,每次按下Ctrl+C,都会打印对应内容(实现自定义的功能而不是像原来一样终止进程),而sigNum也证明Ctrl+C对应的信号值确实是2号。
但不是所有的信号都可以被自定义(捕捉)的,比如9号信号SIGKILL。
6.处理信号的一般方式
- 1.忽略此信号。
- 2.执行该信号的默认处理动作(系统中已经定义好的)。
- 3.提供一个信号处理函数(像上面那样自定义的函数),要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉一个信号。
二、信号产生
1.通过终端按键(键盘)产生信号
介绍两个常用的键盘输入产生的信号:Ctrl+C发送2号信号SIGINT、Ctrl+\\发送3号信号SIGQUIT。(注意键盘输入的信号不止这两个,这里只是以这两个为例)
SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且Core Dump。
Core Dump(核心转储)
当一个进程异常终止时,可以把进程的核心数据全部转而储存到磁盘上,文件名通常是core.PID,这一现象叫做Core Dump。
一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存在PCB中)。默认是不允许产生core文件的,因为core文件中可能包含用户密码等敏感信息,泄漏会导致不安全。
如下图中所示云服务器环境中一般不允许产生core文件(core file size的值为0)。
通过ulimit -c修改core file size后,再次用Ctrl+\\发送信号,可以看到进程被终止且产生了core文件。
2.程序异常
程序异常时操作系统会向程序发送信号来终止进程,这一结果可以通过core文件来看到,下面通过用core文件进行事后调试来讲解上述过程。
事后调试
进程异常终止通常是因为有Bug(比如非法内存访问导致段错误),事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug(事后调试)。
通过下面的代码(有除零错误)来大致演示通过core文件调试。
#include <stdio.h>
#include <unistd.h>
int main()
while (1)
sleep(1);
int a = 1 / 0;//除零错误
return 0;
运行可执行程序及后续调试如下:
可以看到core文件中包含的调试信息非常详细、精准,如果代码量极大,那么core文件会更加快速地调试。
而上面的Floating point exception报错和core中收到的8号信号SIGFPE刚好对应。
3.调用函数
(1)kill函数
mykill.c如下,通过它产生可执行程序kill并传入命令行参数来终止其他进程。
#include <signal.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
int main(int argc, char* argv[])
//argv[0]是执行可执行程序
//argv[1]是进程的pid
//argv[2]是发送的信号编号
//argv[3]是NULL
//argc是有效参数3
if (argc != 3)
printf("input error!\\n");
exit(1);
else
pid_t pid = atoi(argv[1]);
int sigNo = atoi(argv[2]);
kill(pid, sigNo);
return 0;
mytest.c如下,一个简单的死循环,等待可执行程序kill发送信号将其终止。
#include <signal.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
int main()
while (1)
printf("a\\n");
sleep(1);
return 0;
运行test死循环后用可执行程序kill传入test的pid和信号编号来向test发送信号,注意不是使用的命令行中的kill,而是用的自己实现的可执行程序。
(2)raise函数
raise是自己给自己发送信号,与kill不同。
#include <signal.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
//处理传入的信号编号
void handler(int signo)
printf("get a signal : %d\\n", signo);
int main()
signal(2, handler);//将2号信号自定义
while (1)
printf("I am a process, pid : %d\\n", getpid());
sleep(1);
raise(2);//该进程自己给自己发送2号信号
return 0;
可以看拿到,每次该进程自己向自己发送信号,就输出自定义后的内容。
(3)abort
abort使当前进程接收到信号而异常终止。
#include <signal.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
void handler(int signo)
printf("get a signal : %d\\n", signo);
int main()
signal(6, handler);
while (1)
printf("I am a process, pid : %d\\n", getpid());
sleep(1);
abort();
return 0;
可以看到,运行到abort后收到6号信号,然后程序就终止了;
4.由于软件条件产生信号
(1)SIGPIPE
SIGPIPE就是一种因软件条件产生的信号,在【万字详解Linux系列】进程间通信(IPC) 中已经介绍过,这里不多赘述。
(2)SIGALRM
触发SIGALRM信号需要用到alarm函数,函数介绍如下:
函数的返回值是0或是之前设定的闹钟时间还余下的秒数。
#include <signal.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
int main()
int count = 0;
alarm(1);//倒计时1s
while (1)
printf("count : %d\\n", count++);//看看1s内可以将一个整型值加到多少
return 0;
可以看到1s的定时内,count被加到了17482,之后Alarm clock也说明进程收到了SIGALRM的信号。
5.硬件异常产生信号
发生硬件异常时,它被硬件以某种方式检测到并通知内核,然后内核向当前进程发送适当的信号。
例如当前进程执行了除零的指令,CPU的运算单元会产生异常,内核将这个异常解释为SIGFPE信号,并将该信号发送给进程。
再如当前进程访问了非法内存地址,MMU会产生异常,内核将这个异常解释为SIGSEGV信号,并将该信号发送给进程。
三、信号阻塞
1.相关概念
- 实际执行信号的处理动作称为信号递达(Delivery)。
- 信号从产生到递达之间的状态,称为信号未决(Pending)。
- 进程可以选择阻塞 (Block)某个信号。
- 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作。
注意:阻塞和忽略是不同的,阻塞本质是不让信号递达(直到解除阻塞),而忽略本质是递达(处理信号)的一种方式。
2.内核中的表示
-
如上,每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。
-
信号产生时,内核在进程控制块中设置该信号的未决标志(pending),直到信号递达才清除该标志。之后如果被阻塞,则直到阻塞结束才处理,否则直接调用handler内的方法处理该信号。
在上图的例子中:
- SIGHUP信号未阻塞也未产生过,如果它递达则执行默认处理动作。
- SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号。
- SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。
注意:在Linux下如果常规信号在递达之前产生多次则只记最后一次,而实时信号在递达之前产生多次可以依次放在一个队列里。但本篇暂不讨论实时信号。
3.sigset_t
从上图来看,每个信号只有一个比特位的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志同理。
因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态。在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有 效”和“无效”的含义是该信号是否处于未决状态。
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些比特位则是与操作系统有关的(所以不能冒然用按位与、按位或来拿到信号,因为操作系统底层不一定是这么实现的)。
从使用者的角度是不必关心的,使用者只能调用下面介绍的函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t,这是毫无意义的。
4.信号集操作函数
(1)对信号集的操作
常用的信号集操作函数有如下五个,各自的大致用法已注释在其后。
#include <signal.h>//头文件
int sigemptyset(sigset_t *set);//初始化set所指向的信号集,使其中所有信号的比特位清零,表示该信号集不包含任何有效信号
int sigfillset(sigset_t *set);//初始化set所指向的信号集,使其中所有信号的对应比特位置为1,表示该信号集的有效信号包括系统支持的所有信号
int sigaddset (sigset_t *set, int signo);//向信号集set中添加编号为signo的信号
int sigdelset(sigset_t *set, int signo);//从信号集set中删除编号为signo的信号
int sigismember(const sigset_t *set, int signo);//判断编号为signo的信号是否在信号集set中
这四个函数都是成功返回0、出错返回-1。sigismember用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。
注意,上面五个函数都是系统级别的函数,它们在使用时并不会影响进程的任何信息(不会修改进程的PCB)。
(2)sigpromask
调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集,即上面的block表)。
how有三个选项(下面的式子中假设mask是当前的信号屏蔽字,且这些式子只是帮助理解,不能实际写在代码中)
- SIG_BLOCK:这时传入的set包含了希望添加到当前信号屏蔽字(block表)中的信号,可以理解为mask=mask | set。
- SIG_UNBLOCK:这时传入的set包含了希望从当前信号屏蔽字(block表)中取消阻塞的信号,可以理解为mask=mask & ~set。
- SIG_SETMASK:设置当前的信号屏蔽字为传入的set,相当于mask=set。
set就是传入一个信号集,然后根据how的选项来进行操作。
oset是输出型参数,传入NULL时不做处理,如果传入非空则将原来的信号屏蔽字返回至oset,也就是拿到了修改之前的信号屏蔽字。
三个参数的功能整理如下:
- 如果oset是非空指针,则当前进程的信号屏蔽字通过oset参数传出。
- 如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。
- 如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。
(3)sigpending
这个函数非常简单,就是获取当前进程的pending位图。
(4)使用函数
下面的代码的大致功能是首先阻塞2号信号SIGINT,然后不断打印pending表(这时应该是全0),当向该进程发送2号信号后会观察到pending表第二位变为1(被阻塞而无法递达)。
#include <stdio.h>
#include <unistd.h>
#include <signal.h>
void printPending(sigset_t *pending)
//依次打印31个信号
int i = 1;
for (i = 1; i <= 31; i++)
//用sigismember判断第i个信号是否存在于pending表中
if (sigismember(pending, i))
printf("1");//存在打印1
else
printf("0");//不存在打印0
printf("\\n");
int main()
sigset_t set, oset;
//初始化
sigemptyset(&set);
sigemptyset(&oset);
sigaddset(&set, 2);//将2号信号加入set信号集
sigprocmask(SIG_SETMASK, &set, &oset);//将2号信号加入信号屏蔽字,并将原来的信号集返回至oset
sigset_t pending;//保存pending表
while (1)
sigemptyset(&pending);//初始化
sigpending(&pending);//拿到pending表
printPending(&pending);//打印pending表
sleep(1);//每隔一秒打印一次
return 0;
运行如下:
最后通过Ctrl+\\发送信号终止进程成功了,因为这个信号没有被阻塞;但由于Ctrl+C发送的信号被阻塞,所以无法终止进程。
对上面的程序略加修改,使2号信号在阻塞5s后递达给进程,结果是终止进程。
#include <stdio.h>
#include <unistd.h>
#include <signal.h>
void printPending(sigset_t *pending)
//依次打印31个信号
int i = 1;
for (i = 1; i <= 31; i++)
//用sigismember判断第i个信号是否存在于pending表中
if (sigismember(pending, i))
printf("1");//存在打印1
else
printf("0");//不存在打印0
printf("\\n");
int main()
sigset_t set, oset;
//初始化
sigemptyset(&set);
sigemptyset(&oset);
sigaddset(&set, 2);//将2号信号加入set信号集
sigprocmask(SIG_SETMASK, &set, &oset);//将2号信号加入信号屏蔽字,并将原来的信号集返回至oset
sigset_t pending;//保存pending表
int count = 0;
while (1)
sigemptyset(&pending);//初始化
sigpending(&pending);//拿到pending表
printPending(&pending);//打印pending表
sleep(1);
count++;
if (count >= 5)//5秒后解除阻塞
//恢复刚开始的信号屏蔽字(2号信号被解除阻塞)
sigprocmask(SIG_SETMASK, &oset, NULL);
//恢复信号屏蔽字后,2号信号不再被阻塞,而是递达给进程
//于是进程被终止
return 0;
现象如下,打印两次后向进程发送2号信号SIGINT,又打印三次后解除阻塞,信号递达,进程终止。
四、内核态和用户态
进程收到信号后不是立即对其进行处理的,而是在“合适”的时候,这个“合适”的时候指的是从内核态切换回用户态时。那么什么是内核态和用户态,下面进行介绍。
内核态通常执行OS的代码,是一种权限非常高的状态。用户态通常执行普通用户的代码,是一种受监管的普通状态。
五、信号处理的完整过程
了解了上面的相关知识后,就不难理解下面信号处理的完整过程了,具体见下图。
如果忽略收到的信号或是按照默认处理动作处理时,整个过程比较简单(因为没有设计到多次设计状态的切换),而处理自定义的动作叫做信号捕捉,下面讲到的就是信号捕捉。
六、信号捕捉
sigaction
- sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回- 1。signo是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体。
- 将sa_handler赋值为常数SIG_IGN表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数。该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用。
- 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。 sa_flags字段包含一些选项,后面的代码都把sa_flags设为0;sa_sigaction是实时信号的处理函数,本篇暂不详细解释这两个字段。
当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。
运行下面的代码:
#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <signal.h>
struct sigaction act, oact;//两个传入sigaction的结构体
void handler(int signo)
printf("get a signal : %d\\n", signo);
sigaction(SIGINT, &oact, NULL);//将SIGINT的处理动作改为最开始的(系统默认的)
int main()
//初始化
memset(&act, 0, sizeof(act));
memset(&oact, 0, sizeof(oact));
act.sa_handler = handler;//捕捉信号
act.sa_flags = 0;
sigemptyset(&act.sa_mask);//初始化
sigaction(SIGINT, &act, &oact);//传入act修改SIGINT的处理动作
while (1)
printf("hello world!\\n");
sleep(1);
return 0;
现象如下:
<
以上是关于万字详解Linux系列进程信号的主要内容,如果未能解决你的问题,请参考以下文章