Linux系统编程—— 进程之进程控制函数exec系列函数

Posted 尹成

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux系统编程—— 进程之进程控制函数exec系列函数相关的知识,希望对你有一定的参考价值。

 

在Linux中,并不存在exec()函数,exec指的是一组函数,一共有6个,分别是:

#include <unistd.h>
extern char **environ;
int execl(const char *path, const char*arg, ...);
int execlp(const char *file, const char*arg, ...);
int execle(const char *path, const char*arg, ..., char * const envp[]);
int execv(const char *path, char *constargv[]);
int execvp(const char *file, char *constargv[]);
int execve(const char *path, char *constargv[], char *const envp[]);

 

其中只有execve是真正意义上的系统调用,其它都是在此基础上经过包装的库函数。

exec函数族的作用是根据指定的文件名找到可执行文件,并用它来取代调用进程的内容,换句话说,就是在调用进程内部执行一个可执行文件。这里的可执行文件既可以是二进制文件,也可以是任何Linux下可执行的脚本文件。

当fork创建新进程时,即可使用exec函数执行新的程序,但并不是创建新的进程。

 

1、execl()

int execl(const char *path, const char*argv.......);


函数执行成功则不返回,否则返回-1

功能:execl()用于执行参数path字符串代表的文件路径,接下来参数代表执行文件时传递argv, 最后一个参数必须以空指针结束。

2、execle()

int execle(const char *path, const char*argv.....,const char *envp[])


功能:执行那个参数path字符代表的文件路径,接下来参数代表执行文件时传递的参数argv,最后一个参数必须指向一个新的环境变量数组,成为新执行程序的环境变量。

3、execlp()

int execlp(const char *path, const char*arg......)


功能:从path环境变量所指目录中查找符合参数file的文件名,找到后执行该文件,接下来参数代表执行文件时传递的argv[0],最后一个参数必须以空指针NULL。

4、execv()

int execv(const char *path, const char*arg[])


功能:执行参数path字符代表的文件路径,第二参数以数组指针来传递给执行文件。

5、execve()

int execve(const char *filename, const char*argv[], const char *envp[])


功能:执行filename字符串代表的文件路径,中间参数利用数组指针来传递给执行文件,最后一个参数为传递给执行文件的新环境变量数组。

6、execvp()

int execvp(const char *filename, const char*argv[])


功能:从path环境变量所指定目录中查找符合参数file的文件名, 找到后执行此文件,第二个参数argv传递给要执行的文件

 

这6个函数都是以exec开头(表示属于exec函数组),前3个函数接着字母l的,后3个接着字母v的,我的理解是l表示list(列举参数),v表示vector(参数向量表)

。它们的区别在于,execv开头的函数是以"char *argv[]"(vector)形式传递命令行参数,而execl开头的函数采用了罗列(list)的方式,把参数一个一个列出来,然后以一个NULL表示结束。这里的NULL的作用和argv数组里的NULL作用是一样的。

字母p是指在环境变量PATH的目录里去查找要执行的可执行文件。2个以p结尾的函数execlp和execvp,看起来,和execl与execv的差别很小,事实也如此,它们的区别从第一个参数名可以看出:除 execlp和execvp之外的4个函数都要求,它们的第1个参数path必须是一个完整的路径,如"/bin/ls";而execlp和execvp 的第1个参数file可以仅仅只是一个文件名,如"ls",这两个函数可以自动到环境变量PATH指定的目录里去查找。

字母e是指给可执行文件指定环境变量。在全部6个函数中,只有execle和execve使用了char *envp[]传递环境变量,其它的4个函数都没有这个参数,这并不意味着它们不传递环境变量,这4个函数将把默认的环境变量不做任何修改地传给被执行的应用程序。而execle和execve用指定的环境变量去替代默认的那些。

返回值

与一般情况不同,exec函数族的函数执行成功后不会返回,因为调用进程的实体,包括代码段,数据段和堆栈等都已经被新的内容取代,只有进程ID等一些表面上的信息仍保持原样。调用失败时,会设置errno并返回-1,然后从原程序的调用点接着往下执行。

与其他系统调用比起来,exec很容易失败,被执行文件的位置,权限等很多因素都能导致调用失败。因此,使用exec函数族时,一定要加错误判断语句。最常见的错误:

找不到文件或路径,此时errno被设置为ENOENT;

数组argv和envp忘记用NULL结束,此时errno被设置为EFAULT;

没有对要执行文件的运行权限,此时errno被设置为EACCES。

 

为此,Linux还专门对fork作了优化:通常fork会将调用进程的所有内容原封不动的拷贝到新产生的子进程中去,这些拷贝的动作很消耗时间,而如果fork完之后我们马上就调用exec,那这些辛辛苦苦拷贝来的东西就会被立刻抹掉,这看起来非常不划算,于是人们设计了一种"写时复制(copy-on-write)" 技术,使得fork结束后并不立刻复制父进程的内容到子进程,而是到了真正使用时才复制,这样如果下一条语句是exec,它就不会作无用功了。其实"写时复制"还是有复制,进程的mm结构、页表都还是被复制了("写时复制"也必须由这些信息来支撑。否则内核捕捉到CPU访存异常,怎么区分这是“写时复制”引起的,还是真正的越权访问呢?)。

而vfork就把事情做绝了,所有有关于内存的东西都不复制了,父子进程的内存是完全共享的。但是这样一来又有问题了,虽然用户程序可以设计很多方法来避免父子进程间的访存冲突。但是关键的一点,父子进程共用着栈,这可不由用户程序控制的。一个进程进行了关于函数调用或返回的操作,则另一个进程的调用栈(实际上就是同一个栈)也被影响了。这样的程序没法运行下去。所以,vfork有个限制,子进程生成后,父进程在vfork中被内核挂起,直到子进程有了自己的内存空间(exec**)或退出(_exit)。并且,在此之前,子进程不能从调用vfork的函数中返回(同时,不能修改栈上变量、不能继续调用除_exit或exec系列之外的函数,否则父进程的数据可能被改写)。

尽管限制很多,vfork后马上exec效率会比fork高不少。

下面是一个例子:

#include <unistd.h>
int main(void)

   char *envp[] = "PATH=/tmp", "USER=root","STATUS=test", NULL;
   char *argv_execv[] = "echo", "excuted by execv",NULL;
   char *argv_execvp[] = "echo", "executed by execvp",NULL;
   char *argv_execve[] = "env", NULL;
 
   if (fork() == 0)
       if (execl("/bin/echo", "echo", "executed byexecl", NULL) < 0)
           perror("Err on execl");
 
   if (fork() == 0)
       if (execlp("echo", "echo", "executed byexeclp", NULL) < 0)
           perror("Err on execlp");
 
   if (fork() == 0)
       if (execle("/usr/bin/env", "env", NULL, envp) <0)
           perror("Err on execle");
 
   if (fork() == 0)
       if (execv("/bin/echo", argv_execv) < 0)
           perror("Err on execv");
 
   if (fork() == 0)
       if (execvp("echo", argv_execvp) < 0)
           perror("Err on execvp");
 
   if (fork() == 0)
       if (execve("/usr/bin/env", argv_execve, envp) < 0)
           perror("Err on execve");

由于各个子进程执行的顺序无法控制,所以有可能出现一个比较混乱的输出--各子进程打印的结果交杂在一起,而不是严格按照程序中列出的次序。若将程序中fork都改为vfork,则各个exec执行的程序将按序执行。

 

 

以上是关于Linux系统编程—— 进程之进程控制函数exec系列函数的主要内容,如果未能解决你的问题,请参考以下文章

Linux系统编程之程序的执行(exec函数族)

Linux系统编程——进程替换:exec 函数族

Linux系统编程——进程替换:exec 函数族

Linux系统编程——进程替换:exec 函数族

Linux系统编程之进程控制

Linux系统编程-进程创建(fork)外部程序调用(exec)