Linux系统编程---孤儿进程与僵尸进程
1、前言
在上一篇博客文章已经对Linux系统编程内容进行了较为详细的梳理,本文将在上一篇的基础上,继续梳理Linux系统编程中关于孤儿进程和僵尸进程的知识脉络。如有疑问的博客朋友可以通过下面的博文链接进行参考学习。
Linux系统编程---多进程-CSDN博客https://blog.csdn.net/weixin_49337111/article/details/147340286?spm=1001.2014.3001.5501 为什么需要了解孤儿进程和僵尸进程 ???
了解 孤儿进程(Orphan Process) 和 僵尸进程(Zombie Process) 是深入理解 Linux/Unix 进程管理的关键,尤其在开发高可靠性服务、调试系统问题或优化资源管理时至关重要。
理解孤儿进程和僵尸进程,能帮助编写出更加可靠的多进程程序、有效管理系统资源、快速定位异常,并避免安全漏洞。这是与Linux系统开发或运维相关岗位的基本功!
2、孤儿进程
孤儿进程:一般情况下,调用fork()函数创建的子进程,父进程如果比子进程先退出,那么这个子进程称之为 孤儿进程。那么,祖先进程init 就会成为该子进程的父进程,回收该子进程的资源。(老爸走了 儿子还在 国家收养)
在Linux系统中有系统接管机制,会定期调用wait函数接管回收孤儿进程的资源。Linux通过进程继承机制将孤儿进程的父进程重置,确保进程不会完全失控。进程会被系统的 init 祖先进程(PID=1) 或 systemd 进程接管,由它们负责回收资源并处理后续状态。
因为Linux对孤儿进程做了自动回收处理机制,因此孤儿进程通常不会导致系统问题,但孤儿进程长期运行,可能占用资源,有资源泄露风险,需通过日志监控。
在编写多进程程序时,父进程应通过 waitpid( ) 或信号处理(如 SIGCHLD)主动回收子进程。
孤儿进程的产生必须要满足以下两个条件:
- 父进程早于子进程终止(正常退出或意外崩溃)。
- 子进程仍在运行,但失去与原父进程的关联。
孤儿进程程序示例:
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>/*
孤儿进程:一般情况下,调用fork()函数创建的子进程,父进程如果比子进程先退出,那么这个子进程称之为 孤儿进程。
那么,祖先进程init 就会成为该子进程的父进程,回收该子进程的资源
*/int main(int argc, char **argv)
{printf(" main 当前进程的ID号:%d\n",getpid());pid_t id = fork();if(id >0) //子进程{printf("[%d] 我是父进程 准备退出.....\n",getpid());sleep(5);}else if(id == 0) //子进程{sleep(25); //延时20s之后,父进程此时已经退出了,子进程变成了孤儿进程//孤儿进程 是 在失去 父进程的时候 马上 寻找继父printf("[%d] 我是儿子,准备退出....\n", getpid());printf("我的继父进程id:%d\n", getppid());}return 0;
}
程序运行结果:
通过 ps -ef 可以查看到,在父进程退出子进程成为孤儿进程后,由 /lib/systemd/systemd --user 进程进行了接管。
Snail@ubuntu:~/Desktop/demo$ ps -ef UID PID PPID C STIME TTY TIME CMD root 1 0 0 16:03 ? 00:00:03 /sbin/init auto noprompt ... Snail 1613 1 0 16:07 ? 00:00:01 /lib/systemd/systemd --user ... root 6919 1613 0 16:31 pts/2 00:00:00 ./sys_demo
3、僵尸进程
在Linux系统中,僵尸进程(Zombie Process)是指已经终止(结束运行)但其父进程尚未调用 wait() 或 waitpid() 系统调用来回收其资源的子进程。僵尸进程不占用CPU或内存资源,但会保留其进程描述符(Process Descriptor) 在系统的进程表中,直到父进程处理其终止状态。
通俗易懂的话来说就是,父进程还存在,但是去做的别的事情了(比如在一个死循环,没有退出),此时子进程退出之后,就变成了僵尸进程。
(可以用ps -ef 查看,进程的状态栏为defunct,这就是所谓的“僵尸”进程)。
僵尸进程的特点:
- 不占用CPU或内存(已终止,仅保留进程表项)。
- 进程状态为 Z(Zombie)(可通过 ps 或 top 查看)。
- 无法被 kill 命令杀死(因为它已经是“死”进程,只能由父进程或 init 回收)。
僵尸进程产生的核心条件:
- 子进程先于父进程终止。
- 父进程未主动回收子进程。
僵尸进程程序示例:
#include<stdio.h>
#include <sys/types.h>
#include <unistd.h>/*
僵尸进程:父进程还存在,但是去做的别的事情了(比如在一个死循环,没有退出),
此时子进程退出之后,就变成了僵尸进程。
(可以用ps -ef 查看,进程的状态栏为defunct,这就是所谓的“僵尸”进程)*/int main()
{printf(" main 当前进程的ID号:%d\n",getpid());//创建一个子进程pid_t id = fork();if(id >0) //父进程{while(1){sleep(1);printf("[%d] 我是你爹,但是我正在做别的事情.....\n",getpid());}}
else if(id == 0) //子进程{printf("[%d]我是儿子,准备退出....\n",getpid());return 0;}return 0;
}
程序运行结果:
通过 ps -ef 可以查看到,在子进程退出后,因父进程迟迟未结束,且父进程未主动回收子进程,子进程变成了僵尸进程,进入了僵尸态。
Snail@ubuntu:~/Desktop/demo$ ps -ef UID PID PPID C STIME TTY TIME CMD root 1 0 0 16:03 ? 00:00:04 /sbin/init auto nopromp ... Snail 10651 5605 0 17:27 pts/0 00:00:00 /usr/bin/bash --init-fi ... Snail 10814 10651 0 17:27 pts/0 00:00:00 ./a.out Snail 10815 10814 0 17:27 pts/0 00:00:00 [a.out] <defunct>
解决进程的僵尸态问题:
①、父进程还在,主动回收资源:
等待一个进程的目的就是帮这个进程修改状态 (从僵尸态变成死亡态)
阻塞回收:调用 wait( ) 或 waitpid( )
非阻塞回收:WNOHANG
②、父进程退出后,子进程会寻找继父帮自己回收资源:
验证父进程还在,但是不主动回收资源,结果就是这个子进程会一直等待父进程的退出之后,然后去寻找继父帮自己回收资源。
③、父进程忽略 SIGCHLD(自动回收):
如果父进程 不回收子进程 且 不忽略 SIGCHLD,子进程会 保持僵尸状态。
直到:父进程终止时子进程被继父进程接管并回收 或 系统重启时所有进程被清理。