进程退出
进程退出场景
进程退出无非以下三种情况:
- 代码运⾏完毕,结果正确
- 代码运⾏完毕,结果不正确
- 代码异常终止
进程退出码
在编程中,我们通常认为main函数是代码的入口,但实际上它只是用户级别代码的入口。main函数是被其他函数间接调用的,例如在VS2013中,main函数由*__tmainCRTStartup函数调用,而__tmainCRTStartup*函数又是通过加载器被操作系统调用。所以,main函数是间接性被操作系统所调用。
由于main函数是这样被调用的,当main函数调用结束后,应该给操作系统返回相应的退出信息。这个退出信息以退出码的形式作为main函数的返回值返回。一般情况下,我们以0表示代码成功执行完毕,以非0表示代码执行过程中出现错误。这就是为什么我们常在main函数的最后返回0。
执行以下代码:
1 |
|
我们可以通过*echo $?* 查看最近进程的退出码

进程正常退出返回0,如果进程不是正常退出就会返回其对应的退出码,在C语言中我们可以通过strerror函数打印出对应的错误信息。
1 |
|

需要注意的是: 退出码都有对应的字符串含义,帮助用户确认执行失败的原因,而这些退出码具体代表什么含义是人为规定的,不同环境下相同的退出码的字符串含义可能不同。
exit与_exit函数


exit函数可以在代码中的任何地方退出进程,并且exit函数在退出进程前会做一系列工作:
- 执行用户通过atexit或on_exit定义的清理函数。
- 关闭所有打开的流,所有的缓存数据均被写入。
- 调用*_exit*函数终止进程。

例如以下代码:
1 |
|

如果我们使用的是*_exit*函数,那么进程就会直接退出,并不会做任何处理。(缓冲区不会刷新……)
1 |
|

总结:
- 首先只有在main函数当中的return才能起到退出进程的作用,子函数当中return不能退出进程,而exit函数和*_exit*函数在代码中的任何地方使用都可以起到退出进程的作用。
- 使用exit函数退出进程前,exit函数会执行用户定义的清理函数、冲刷缓冲,关闭流等操作,然后再终止进程,而*_exit*函数会直接终止进程,不会做任何收尾工作。
进程等待
为什么?
之前讲过,⼦进程退出,⽗进程如果不管不顾,就可能造成‘僵⼫进程’的问题,进⽽造成内存泄漏。 另外,进程⼀旦变成僵⼫状态,那就⼑枪不⼊,“杀⼈不眨眼”的kill -9 也⽆能为⼒,因为谁也 没有办法杀死⼀个已经死去的进程。最后,⽗进程派给⼦进程的任务完成的如何,我们需要知道。如,⼦进程运⾏完成,结果对还是不对,或者是否正常退出。⽗进程通过进程等待的⽅式,回收⼦进程资源,获取⼦进程退出信息
怎么做?

status参数
其中这两个关于进程等待的函数都有一个共同的参数status,如果对status参数传入NULL,表示不关心子进程的退出状态信息。否则,操作系统会通过该参数,将子进程的退出信息反馈给父进程。
status虽然是一个整型变量,但status不能简单的当作整型来看待,因为status的不同比特位所代表的信息不同,一般我们只考虑低的16个比特位。
在*status的低16比特位当中,高8位表示进程的退出状态,即退出码。进程若是被信号所杀,则低7位表示终止信号,而第8位比特位是core dump标志。

一般我们可以通过相关的位运算得到进程的退出码与退出信号。
1 | exitCode = (status >> 8) & 0xFF; //退出码 11111111 |
为了降低用户的使用成本,操作系统也为我们提供了两个宏表示对应的退出码与退出信号。
- WIFEXITED(status):用于查看进程是否是正常退出,本质是检查是否收到信号。
- WEXITSTATUS(status):用于获取进程的退出码。
wait
1 | pid_t wait(int* status); |
下面的代码我们用父进程一直等待子进程,然后获取其退出信息。
1 |
|
子进程正常退出,父进程等待子进程退出后获取退出信息,没有出现僵尸。


我们用kiil -9杀死父进程也能回收退出信息


waitpid
1 | pid_ t waitpid(pid_t pid, int *status, int options); |
- 如果⼦进程已经退出,调⽤wait/waitpid时,wait/waitpid会⽴即返回,并且释放资源,获得⼦ 进程退出信息。
- 如果在任意时刻调⽤wait/waitpid,⼦进程存在且正常运⾏,则进程可能阻塞。
- 如果不存在该⼦进程,则⽴即出错返回。
下面的代码创建子进程后,父进程可使用waitpid函数一直等待子进程(此时将waitpid的第三个参数设置为0),直到子进程退出后读取子进程的退出信息。
1 |
|
并且我们还可以创建多个进程,父进程等待多个子进程。
1 |
|

非阻塞轮询
在传统的父子进程关系中,当子进程未退出时,父进程通常处于阻塞等待状态,在此期间父进程不能进行其他操作。
然而,我们可以采用非阻塞等待的方式。具体做法是在调用waitpid函数时,向第三个参数options传入WNOHANG(不要夯住)。这样,如果等待的子进程没有结束,waitpid函数将直接返回 0,父进程不进行等待,可以去做自己的事情。而当等待的子进程正常结束时,waitpid函数会返回该子进程的pid,此时父进程可以读取子进程的退出信息。
1 |
|

进程替换
概念
我们前面知道,父子进程是共享代码与数据的,如果修改子进程的数据就会发生写实拷贝。而今天我们需要修改子进程的代码,则需要进行进程替换。
当进程替换时,该进程的用户空间代码和数据完全被新程序替换,并从新程序的启动例程开始执行。

如果父子进程共享数据与代码,当对子进程进行进程替换时就会发生写实拷贝,所以对子进程就行进程替换并不会影响父进程。
进程替换函数
以下六个函数可以进行进程替换

如果替换失败函数返回 -1 ,替换成功什么也不返回,如果要返回,那返回给谁呢?源程序的代码都被替换了。
命名理解
| l(list) | 表示参数采⽤列表 |
|---|---|
| v(vector) | 参数⽤数组 |
| p(path) | 有p⾃动搜索环境变量PATH |
| e(env) | 表示⾃⼰维护环境变量 |
| 函数名 | 参数格式 | 是否带路径 | 是否使用当前环境变量 |
|---|---|---|---|
| execl | 列表 | 不是 | 是 |
| execlp | 列表 | 是 | 是 |
| execle | 列表 | 不是 | 不是,自己组装环境变量 |
| execv | 数组 | 不是 | 是 |
| execvp | 数组 | 是 | 是 |
| execvpe | 数组 | 是 | 不是,自己组装环境变量 |
execl举例:
- path是要执行程序的路径,arg是可变参数列表,表示你要如何执行这个程序, 注意以NULL为参数传递的结尾。
1 |
|

并且我们也可能通过该接口,调用其他语言的脚本,如python,shell脚本。
execle举例
- int execle(const char *path, const char *arg, …, char *const envp[]);
- path是要执行程序的路径,arg是可变参数列表,表示你要如何执行这个程序, 注意以NULL为参数传递的结尾,envp是你自己设置的环境变量
例如,你设置了MYVAL环境变量,在MYCMD程序内部就可以使用该环境变量
1 | char* myenvp[] = { "MYVAL=2021", NULL }; |
execv举例
- int execv(const char *path, char *const argv[]);
- path是要执行程序的路径,argv是一个指针数组,数组当中的内容表示你要如何执行这个程序,数组以NULL结尾
1 | char* myargv[] = { "ls", "-a", "-i", "-l", NULL }; |
事实上,在系统调用中,只有execve才是真正的系统调用,其他五个函数(如execl、execle、execlp、execv、execvp)都是对execve函数的封装,目的是为了满足不同用户的需求。这也导致了在man手册中,execve位于第 2 节,而其他五个函数在第 3 节。
本期博客到这里就结束了,如果有什么错误,欢迎指出,如果对你有帮助,请点个赞,谢谢!
