本章介绍Unix的进程控制,包括进程创建,执行程序和进程终止,进程的属性,exec函数系列,system函数,进程会计机制。
1、进程标识符
每一个进程都有一个非负整数标识的唯一进程ID。ID为0表示调度进程,即交换进程,是内核的一部分,也称为系统进程,不执行任何磁盘操作。ID为1的进程为init进程,init进程不会终止,他是一个普通的用户进程,需要超级用户特权运行。获取标识符函数如下:
#include <sys/types.h>
#include <unistd.h>
pid_t getpid(void); //调用进程的进程ID
pid_t getppid(void); //调用进程的父进程ID
gid_t getgid(void); //调用进程的实际组ID
gid_t getegid(void); //调用进程的有效组ID
uid_t getuid(void); //调用进程的实际用户ID
uid_t geteuid(void); //调用进程的有效用户ID
2、fork函数
一个现有的进程可以调用fork函数创建一个新进程。函数原型为:pid_t fork(void)。有fork创建的新进程称为子进程,fork函数调用一次返回两次。子进程的返回值为0,父进程的返回值为新子进程的ID。子进程和父进程举行执行fork调用后的指令,子进程是父进程的副本。子进程获得父进程的数据空间、栈和队的副本,父子进程不共享这些存储空间部分,共享正文段。子进程相当于父进程克隆了一份自己。 创建新进程成功后,系统中出现两个基本完全相同的进程,这两个进程执行没有固定的先后顺序,哪个进程先执行要看系统的进程调度策略。
fork出错可能有两种原因:
1)当前的进程数已经达到了系统规定的上限,这时errno的值被设置为EAGAIN。
2)系统内存不足,这时errno的值被设置为ENOMEM。
注意的是:父进程设置的文件锁不会被子进程继承。
写个程序,创建一个子进程,在子进程中改变变量的值,然后父子进程同时输出变量的值,看看有什么变化,同时输出子进程的标识符信息。程序如下:
1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <string.h>
4 #include <sys/types.h>
5 #include <unistd.h>
6 #include <errno.h>
7 //全局变量
8 int global = 100;
9 char buf[]="a write to stdout.\\n";
10
11 int main()
12 {
13 int var;
14 pid_t pid;
15
16 var = 90;
17 write(STDOUT_FILENO,buf,sizeof(buf)-1);
18 //创建一个子进程
19 pid = fork();
20 if(pid == -1) //出错
21 {
22 perror("fork() error");
23 exit(-1);
24 }
25 if(pid == 0) //子进程
26 {
27 printf("This is child process.\\n");
28 printf("Child process id is:%d\\n",getpid());
29 printf("Father process id is:%d\\n",getppid());
30 //子进程修改数据
31 global++;
32 var++;
33 }
34 if(pid > 0) //父进程
35 sleep(3); //等待子进程先执行
36 printf("pid = %d,ppid =%d,global=%d,var=%d\\n",getpid(),getppid(),global,var);
37 return 0;
38 }
从结果可以看出子进程拥有自己的数据空间,不与父进程共享数据空间。
vfork函数的调用序列和返回值与fork相同,但是vfork并不将父进程的地址空间完全复制到子进程中,在调用exec和exit之前在父进程的空间中运行。vfork保证子进程先运行,在它调用exec或exit之后父进程才可能被调度运行。
进程终止最后都会执行内核中的同一段代码,为相应的进程关闭所有打开描述符,释放它所使用的存储器等。子进程可以通过exit函数通知父进程是如何终止的,父进程调用wait或waitpid函数可以获取终止状态。子进程是在父进程调用fork后产生的,如果父进程在子进程之前终止,则将子进程的父进程改变为init进程,保证每一个进程都有一个父进程。一个已经终止,但其父进程尚没有对其进行善后处理的进程称为僵死进程(zombie)。由init进程领养的子进程不会变成僵死进程,因为init进程在子进程终止的时候会调用一个wait函数取得子进程的终止状态。
当一个进程正常或者异常终止的时,内核就像其父进程发送SIGCHLD信号。调用wait和waitpid函数可能发生的情况:(1)如果所有子进程都还在运行,则阻塞;(2)如果一个子进程已经终止,正等待父进程获取进程终止状态,则取得孩子的终止状态立刻返回;(3)若果没有任何子进程,则立即出错返回。如果在任意时刻调用wait,则进程可能会阻塞。
#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int *status); //在一个子进程终止前,wait使调用者阻塞
pid_t waitpid(pid_t pid, int *status, int options); //可以使调用者不阻塞
#include <sys/types.h>
#include <sys/resource.h>
#include <sys/wait.h>
pid_t wait3(int *status, int options,struct rusage *rusage);
pid_t wait4(pid_t pid, int *status, int options, struct rusage *rusage);
写个程序,子进程给出退出状态,父进程通过wait和waitpid获取退出状态。程序如下:
1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <unistd.h>
4 #include <sys/wait.h>
5 #include <sys/types.h>
6 #include <signal.h>
7
8 int main()
9 {
10 pid_t pid;
11 int status;
12 if((pid = fork()) == -1)
13 {
14 perror("fork() error");
15 exit(-1);
16 }
17 if(pid == 0)
18 exit(0);
19 if(wait(&status) == pid)
20 printf("child normal exit,exit status=%d\\n",WEXITSTATUS(status));
21 if((pid = fork()) == -1)
22 {
23 perror("fork() error");
24 exit(-1);
25 }
26 if(pid == 0)
27 abort();
28 if(waitpid(pid,&status,0) == pid)
29 printf("child abnormal termination,signal number=%d\\n",WTERMSIG(status));
30 }
程序执行结果如下:
waitpid函数中的pid参数取值情况:
pid=-1 等待任一子进程,此时相当于wait
pid>0 等待期进程ID与pid相等的子进程
pid==0 等待期组ID等于调用进程组ID的任一个子进程
pid<-1 等待其组ID等于pid绝对值的任一子进程
另外提供了一种避免僵死进程的方法:调用fork两次。
exec函数,用fork函数创建子进程后,子进程往往要调用一种exec函数以执行另外一个程序。当调用exec函数时,该进程执行的程序完全替换为新进程,exec函数不新建进程,只是用一个全新的程序替换了当前的正文、数据、堆和栈段。执行完之后,进程ID不会改变。在进程间通信的时候,经常需要调用exec函数启动另外一个例程。函数原型如下:
#include <unistd.h>
extern char **environ;
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg,..., char * const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *file, char *const argv[],char *const envp[]);
其中l表示列表(list),v标识矢量(vector)。execl、execlp、execle中每个命令行参数都是一个单独参数,这种参数以空指针结尾。execv、execvp、execve命令行参数是一个指针数组。e标识环境变量,传递参数。写个程序进行测试,程序分为两部分,exec调用的程序,exec执行程序。程序如下:
exec调用程序如下,可执行文件名称为exectest,存放在/home/anker/Programs目录下。
1 #include <stdio.h>
2 #include <stdlib.h>
3
4 int main(int argc,char *argv[])
5 {
6 int i;
7 char **ptr;
8 extern char **environ;
9
10 for(i=0;i<argc;++i)
11 printf("argv[%d]=%s\\n",i,argv[i]);
12 for(ptr=environ;*ptr!=0;ptr++)
13 printf("%s\\n",*ptr);
14 exit(0);
15 }
exec执行程序如下:存放在/home/anker/Programs目录下。
#include <stdio.h>
#include <stdlib.h>
#include <sys/wait.h>
#include <unistd.h>
#include <sys/types.h>
#include <errno.h>
char *env_init[] = {"LENGTH=100","PAHT=/tmp",NULL};
int main()
{
pid_t pid;
char *path = "/home/anker/Programs/exectest";
char *filename = "exectest";
char *argv[3]= {0};
argv[0] = "exec";
argv[1] = "test";
if((pid=fork()) == -1)
{
perror("fork() error");
exit(-1);
}
else if(pid == 0)
{
printf("Call execle:\\n");
execle(path,argv[0],argv[1],(char*)0,env_init);
}
waitpid(pid,NULL,0);
if((pid=fork()) == -1)
{
perror("fork() error");
exit(-1);
}
else if(pid == 0)
{
printf("Call execve:\\n");
execve(filename,argv,env_init);
}
waitpid(pid,NULL,0);
exit(0);
}
执行结果如下:
system函数,在程序中执行一个命令字符串。例如system("date > file")。函数原型如下:
#include <stdlib.h>
int system(const char *command);、
system函数实现中调用了fork、exec和waitpid函数,因此有三种返回值。system函数实现一下,没有信号处理。程序如下:
#include <stdio.h>
#include <stdlib.h>
#include <sys/wait.h>
#include <unistd.h>
#include <sys/types.h>
#include <errno.h>
int mysystem(const char * cmdstring);
int main()
{
int status;
status = mysystem("date");
if(status < 0)
{
printf("mysystem() error.\\n");
}
status = mysystem("who");
if(status < 0)
{
printf("mysystem() error.\\n");
}
exit(0);
}
int mysystem(const char * cmdstring)
{
pid_t pid;
int status;
if(cmdstring == NULL)
return 1;
if((pid = fork()) == -1)
{
status = -1;
}
else if(pid == 0) //在子进程中调用shell脚本
{
execl("/bin/sh","sh","-c",cmdstring,(char *)0);
_exit(127);
}
else
{
while(waitpid(pid,&status,0) < 0)
{
if(errno != EINTR)
{
status = -1;
break;
}
}
}
return status;
}
程序执行结果如下:
system函数可以设置用户的ID,这是一个安全漏洞。
进程会计:启用后,每当进程结束时候内核就写一个会计记录,包括命令名、所使用的CPU时间总量、用户ID和组ID、启动时间等。accton命令启动会计处理,会计记录写到指定的文件中,Linux中位于/var/account/ pacct。会计记录结构定义在<sys/acct.h>头文件中。
#define ACCT_COMM 16
typedef u_int16_t comp_t;
struct acct {
char ac_flag; /* Accounting flags */
u_int16_t ac_uid; /* Accounting user ID */
u_int16_t ac_gid; /* Accounting group ID */
u_int16_t ac_tty; /* Controlling terminal */
u_int32_t ac_btime; /* Process creation time(seconds since the Epoch) */
comp_t ac_utime; /* User CPU time */
comp_t ac_stime; /* System CPU time */
comp_t ac_etime; /* Elapsed time */
comp_t ac_mem; /* Average memory usage (kB) */
comp_t ac_io; /* Characters transferred (unused) */
comp_t ac_rw; /* Blocks read or written (unused) */
comp_t ac_minflt; /* Minor page faults */
comp_t ac_majflt; /* Major page faults */
comp_t ac_swaps; /* Number of swaps (unused) */
u_int32_t ac_exitcode; /* Process termination status(see wait(2)) */
char ac_comm[ACCT_COMM+1];/* Command name (basename of last executed command; null-terminated) */
char ac_pad[X]; /* padding bytes */
};
用户标识,用getlogin函数获取用户的登录名。函数原型如下:char *getlogin(void)。
进程时间:墙上时钟时间、用户CPU时间和系统CPU时间。任一个进程都可以调用times函数获取它自己及已终止子进程时间。进程时间操作函数及结构如下:
#include <sys/times.h>
clock_t times(struct tms *buf);
struct tms {
clock_t tms_utime; /* user time */
clock_t tms_stime; /* system time */
clock_t tms_cutime; /* user time of children */
clock_t tms_cstime; /* system time of children */
};
总结:通过本章的学习。完全的了解Unix的进程控制,掌握了fork、exec簇、wait和waitpid进程控制函数。另外学习了system函数和进程会计。了解了解释器文件及其工作方式,用户标识和进程时间。