linux c语言 fork() 和 exec 函数的简介和用法

假如我们在编写1个c程序时想调用1个shell脚本或者执行1段 bash shell命令, 应该如何实现呢?

其实在<stdlib.h> 这个头文件中包含了1个调用shell命令或者脚本的函数 system();直接把 shell命令作为参数传入 system函数就可以了, 的确很方便. 关于system 有一段这样的介绍: system 执行时内部会自动启用fork() 新建1个进程, 效率没有直接使用fork() 和 exec函数高.

那么这篇文章其实就是介绍一下fork() 和 exec函数的用法, 以及如何使用它们来替代system函数.

1. fork() 函数

1.1 fork() 函数的作用

一般来讲, 我们编写1个普通的c程序, 运行这个程序直到程序结束, 系统只会分配1个pid给这个程序, 也就就说, 系统里只会有一条关于这个程序的进程.

但是执行了fork() 这个函数就不同了.

fork 这个英文单词在英文里是"分叉"意思, fork() 这个函数作用也很符合这个意思. 它的作用是复制当前进程(包括进程在内存里的堆栈数据)为1个新的镜像. 然后这个新的镜像和旧的进程同时执行下去. 相当于本来1个进程, 遇到fork() 函数后就分叉成两个进程同时执行了. 而且这两个进程是互不影响

参考下面这个小程序:

[cpp] view plain copy

int fork_3(){
printf("it's the main process step 1!!\n\n");
fork();
printf("step2 after fork() !!\n\n");
int i; scanf("%d",&i); //prevent exiting
return 0;
}

在这个函数里, 共有两条printf语句, 但是执行执行时则打出了3行信息. 如下图:

为什么呢, 因为fork()函数将这个程序分叉了啊, 见下面的图解:

可以见到程序在fork()函数执行时都只有1条主进程, 所以 step 1 会被打印输出1次.

执行 fork()函数后, 程序分叉成为了两个进程, 1个是原来的主进程, 另1个是新的子进程, 它们都会执行fork() 函数后面的代码, 所以 step2 会被两条进程分别打印输出各一次, 屏幕上就总共3条printf 语句了!

可以见到这个函数最后面我用了 scanf()函数来防止程序退出, 这时查看系统的进程, 就会发现两个相同名字的进程:

如上图, pid 8808 那个就是主进程了, 而 pid 8809那个就是子进程啊, 因为它的parent pid是 8808啊!

需要注意的是, 假如没有做特殊处理, 子进程会一直存在, 即使fork_3()函数被调用完成, 子进程会和主程序一样,返回调用fork_3() 函数的上一级函数继续执行, 直到整个程序退出.

可以看出, 假如fork_3() 被执行2次, 主程序就会分叉两次, 最终变成4个进程, 是不是有点危险. 所以上面所谓的特殊处理很重要啊!

1.2 区别分主程序和子程序.

实际应用中, 单纯让程序分叉意义不大, 我们新增一个子程序, 很可能是为了让子进程单独执行一段代码. 实现与主进程不同的功能.

要实现上面所说的功能, 实际上就是让子进程和主进程执行不同的代码啊.

所以fork() 实际上有返回值, 而且在两条进程中的返回值是不同的, 在主进程里 fork()函数会返回主进程的pid, 而在子进程里会返回0! 所以我们可以根据fork() 的返回值来判断进程到底是哪个进程, 就可以利用if 语句来执行不同的代码了!

如下面这个小程序fork_1():

[cpp] view plain copy

int fork_1(){
int childpid;
int i;
if (fork() == 0){
//child process
for (i=1; i<=8; i++){
printf("This is child process\n");
}
}else{
//parent process
for(i=1; i<=8; i++){
printf("This is parent process\n");
}
}
printf("step2 after fork() !!\n\n");
}

我对fork() 函数的返回值进行了判断, 如果返回值是0, 我就让认为它是子进程, 否则是主程序. 那么我就可以让这两条进程输出不同的信息了.

输出信息如下图:

可以见到子程序和主程序分别输出了8条不同的信息, 但是它们并不是规则交替输出的, 因为它们两条进程是互相平行影响的, 谁的手快就在屏幕上先输出, 每次运行的结果都有可能不同哦.

下面是图解:

由图解知两条进程都对fork()返回值执行判断, 在if 判断语句中分别执行各自的代码. 但是if判断完成后, 还是会回各自执行接下来的代码. 所以 step2 还是输出了2次.

1.4 使用exit() 函数令子进程在if 判断内结束.

参考上面的函数, 虽然使用if 对 fork() 的返回值进行判断, 实现了子进程和主进程在if判断的范围内执行了不同的代码, 但是就如上面的流程图, 一旦if执行完成, 他们还是会各自执行后面的代码.

通常这不是我们期望的, 我们更多时会希望子进程执行一段特别的代码后就让他结束, 后面的代码让主程序执行就行了.

这个实现起来很简单, 在子程序的if 条件内最后加上exit() 函数就ok了.

将上面的fork_1()函数修改一下, 加上exit语句:

[cpp] view plain copy

int fork_1(){
int childpid;
int i;
if (fork() == 0){
//child process
for (i=1; i<=8; i++){
printf("This is child process\n");
}
exit(0);
}else{
//parent process
for(i=1; i<=8; i++){
printf("This is parent process\n");
}
}
printf("step2 after fork() !!\n\n");
}

再看看输出:

可以见到, step2只输出1次了, 这是因为子程序在 if条件内结束了啊, 一旦 if 判断成, 就只剩下1个主进程执行下面的代码了, 这正是我们想要的!

注意: exit() 函数在 stdlib.h 头文件内

流程图:

1.4 使用wait() 函数主程序等子程序执行完成(退出)后再执行.

由上面例子得知, 主程序和子程序的执行次序是随机的, 但是实际情况下, 通常我们希望子进程执行后, 才继续执行主进程.

例如对于上面的fork_1()函数, 我想先输出子进程的8个 "This is child process" 然后再输出 8个主进程"This is parent process", 改如何做?

wait()函数就提供了这个功能, 在if 条件内的主进程呢部分内加上wait() 函数, 就可以让主进程执行fork()函数时先hold 住, 等子进程退出后再执行, 通常会配合子进程的exit()函数一同使用.

我将fork_1()函数修改一下, 添加了wait()语句:

[cpp] view plain copy

int fork_1(){
int childpid;
int i;
if (fork() == 0){
//child process
for (i=1; i<=8; i++){
printf("This is child process\n");
}
exit(0);
}else{
//parent process
wait();
for(i=1; i<=8; i++){
printf("This is parent process\n");
}
}
printf("step2 after fork() !!\n\n");
}

输出:

见到这时的屏幕输出就很有规律了!

其实wait() 函数还有1个功能, 就是可以接收1个 pid_t(在unistd.h内,其实就是Int啦) 指针类型参数, 给这个参数赋上子进程退出前的系统pid值

流程图:

2. exec 函数组

需要注意的是exec并不是1个函数, 其实它只是一组函数的统称, 它包括下面6个函数:

[cpp] view plain copy

#include <unistd.h>
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);

可以见到这6个函数名字不同, 而且他们用于接受的参数也不同.

实际上他们的功能都是差不多的, 因为要用于接受不同的参数所以要用不同的名字区分它们, 毕竟c语言没有函数重载的功能嘛..

但是实际上它们的命名是有规律的:

exec[l or v][p][e]

exec函数里的参数可以分成3个部分, 执行文件部分, 命令参数部分, 环境变量部分.

例如我要执行1个命令 ls -l /home/gateman

执行文件部分就是 "/usr/bin/ls"

命令参赛部分就是 "ls","-l","/home/gateman",NULL 见到是以ls开头每1个空格都必须分开成2个部分, 而且以NULL结尾的啊.

环境变量部分, 这是1个数组,最后的元素必须是NULL 例如 char * env[] = {"PATH=/home/gateman", "USER=lei", "STATUS=testing", NULL};

好了说下命名规则:

e后续, 参数必须带环境变量部分, 环境变零部分参数会成为执行exec函数期间的环境变量, 比较少用

l 后续, 命令参数部分必须以"," 相隔, 最后1个命令参数必须是NULL

v 后续, 命令参数部分必须是1个以NULL结尾的字符串指针数组的头部指针. 例如char * pstr就是1个字符串的指针, char * pstr[] 就是数组了, 分别指向各个字符串.

p后续, 执行文件部分可以不带路径, exec函数会在$PATH中找

还有1个注意的是, exec函数会取代执行它的进程, 也就是说, 一旦exec函数执行成功, 它就不会返回了, 进程结束. 但是如果exec函数执行失败, 它会返回失败的信息, 而且进程继续执行后面的代码!

通常exec会放在fork() 函数的子进程部分, 来替代子进程执行啦, 执行成功后子程序就会消失, 但是执行失败的话, 必须用exit()函数来让子进程退出!

下面是各个例子:

2.1 execv 函数

[cpp] view plain copy

int childpid;
int i;
if (fork() == 0){
//child process
char * execv_str[] = {"echo", "executed by execv",NULL};
if (execv("/usr/bin/echo",execv_str) <0 ){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execv done\n\n");
}

注意字符串指针数组的定义和赋值

2.2 execvp 函数

[cpp] view plain copy

if (fork() == 0){
//child process
char * execvp_str[] = {"echo", "executed by execvp",">>", "~/abc.txt",NULL};
if (execvp("echo",execvp_str) <0 ){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execvp done\n\n");
}

2.3 execve 函数

[cpp] view plain copy

if (fork() == 0){
//child process
char * execve_str[] = {"env",NULL};
char * env[] = {"PATH=/tmp", "USER=lei", "STATUS=testing", NULL};
if (execve("/usr/bin/env",execve_str,env) <0 ){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execve done\n\n");
}

2.4 execl 函数

[cpp] view plain copy

if (fork() == 0){
//child process
if (execl("/usr/bin/echo","echo","executed by execl" ,NULL) <0 ){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execv done\n\n");
}

2.5 execlp 函数

[cpp] view plain copy

if (fork() == 0){
//child process
if (execlp("echo","echo","executed by execlp" ,NULL) <0 ){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execlp done\n\n");
}

2.6 execle 函数

[cpp] view plain copy

if (fork() == 0){
//child process
char * env[] = {"PATH=/home/gateman", "USER=lei", "STATUS=testing", NULL};
if (execle("/usr/bin/env","env",NULL,env) <0){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execle done\n\n");
}

输出:

3. fork() 和exec 函数与system()函数比较

见到上面execvp函数的输出. 你会发现 exec函数只是系统调用, 它是不支持管线处理的

而system()函数是支持的. 他的内部会自动fork() 1个子进程,但是效率没有fork() 和 exec配合使用好.

但是exec 支持执行脚本. 所以不需要管线处理的命令或者脚本可以利用fork() 和 exec函数来执行.

4. 利用 fwrite() ,fork() 和exec 函数替代system()函数.

上面讲过了, 虽然exec函数不支持管线, 而且命令参数复杂, 但是它支持执行脚本啊, 所以我们可以使用fwrite将有管线处理的命令写入1个脚本中, 然后利用exec函数来执行这个脚本.

下面会编写1个base_exec(char *) 函数, 接收1个字符串参数, 然后执行它.

这里只会大概写出这个函数的逻辑步骤:

1. 利用getuid函数获得当前的pid, 然后利用pid获得当前唯一的文件名, 避免因为相同程序同时执行发生冲突!

2. 利用fwrite函数在 /tmp/下面建立1个上面文件名的脚本文件. 因为/tmp/ 任何用户都可以读写啊

3. 把命令参数写入脚本

4. 利用fork() 和 exec() 执行这个脚本

5. 有需要的话当exec执行完, 记录日志.

下面就是i代码:

头文件:

base_exec.h

[cpp] view plain copy

#ifndef __BASE_EXEC_H_
#define __BASE_EXEC_H_
int base_exec(char *) ;
#endif /* BASE_EXEC_H_ */

源文件:

base_exec.c

[cpp] view plain copy

#include "base_exec.h"
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <time.h>
#define LOGFILE "/home/gateman/logs/c_exec.log"
int base_exec(char * pcmd){
FILE * pf;
pid_t pid = getpid();
char pfilename[20];
sprintf(pfilename, "/tmp/base_exec%d.sh",pid);
pf=fopen(pfilename,"w"); //w is overwrite, a is add
if (NULL == pf){
printf("fail to open the file base_exec.sh!!!\n");
return -1;
}
fwrite("#!/bin/bash\n", 12, 1, pf);
fwrite(pcmd, strlen(pcmd),1, pf);
fwrite("\n", 1,1, pf);
fclose(pf);
if (fork() ==0 ){
//child processj
char * execv_str[] = {"bash", pfilename, NULL};
if (execv("/bin/bash",execv_str) < 0){
perror("fail to execv");
exit(-1);
}
}else{
//current process
wait();
pf=fopen(LOGFILE,"a");
if (NULL == pf){
printf("fail to open the logfile !!!\n");
return -1;
}
time_t t;
struct tm * ptm;
time(&t);
ptm = gmtime(&t);
char cstr[24];
sprintf (cstr, "time: %4d-%02d-%02d %02d:%02d:%02d\n", 1900+ptm->tm_year,ptm->tm_mon,ptm->tm_mday,ptm->tm_hour,ptm->tm_min,ptm->tm_sec);
fwrite(cstr, strlen(cstr),1, pf);
int uid = getuid();
sprintf(cstr, "uid: %d\ncommand:\n",uid);
fwrite(cstr, strlen(cstr),1, pf);
fwrite(pcmd, strlen(pcmd),1, pf);
fwrite("\n\n\n", 3,1, pf);
fclose(pf);
remove(pfilename);
return 0;
}
return 0;
}