当前位置：首页 > news >正文

Linux系统编程---孤儿进程与僵尸进程

news 来源：原创 2025/4/22 23:40:21

1、前言

在上一篇博客文章已经对Linux系统编程内容进行了较为详细的梳理，本文将在上一篇的基础上，继续梳理Linux系统编程中关于孤儿进程和僵尸进程的知识脉络。如有疑问的博客朋友可以通过下面的博文链接进行参考学习。

Linux系统编程---多进程-CSDN博客https://blog.csdn.net/weixin_49337111/article/details/147340286?spm=1001.2014.3001.5501 为什么需要了解孤儿进程和僵尸进程？？？

了解 孤儿进程（Orphan Process）和 僵尸进程（Zombie Process）是深入理解 Linux/Unix 进程管理的关键，尤其在开发高可靠性服务、调试系统问题或优化资源管理时至关重要。

理解孤儿进程和僵尸进程，能帮助编写出更加可靠的多进程程序、有效管理系统资源、快速定位异常，并避免安全漏洞。这是与Linux系统开发或运维相关岗位的基本功！

2、孤儿进程

孤儿进程：一般情况下，调用fork()函数创建的子进程，父进程如果比子进程先退出，那么这个子进程称之为孤儿进程。那么，祖先进程init 就会成为该子进程的父进程，回收该子进程的资源。（老爸走了儿子还在国家收养）

在Linux系统中有系统接管机制，会定期调用wait函数接管回收孤儿进程的资源。Linux通过进程继承机制将孤儿进程的父进程重置，确保进程不会完全失控。进程会被系统的 init 祖先进程（PID=1）或 systemd 进程接管，由它们负责回收资源并处理后续状态。

因为Linux对孤儿进程做了自动回收处理机制，因此孤儿进程通常不会导致系统问题，但孤儿进程长期运行，可能占用资源，有资源泄露风险，需通过日志监控。

在编写多进程程序时，父进程应通过 waitpid( ) 或信号处理（如 SIGCHLD）主动回收子进程。

孤儿进程的产生必须要满足以下两个条件：

父进程早于子进程终止（正常退出或意外崩溃）。
子进程仍在运行，但失去与原父进程的关联。

孤儿进程程序示例：

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>/*
孤儿进程：一般情况下，调用fork()函数创建的子进程，父进程如果比子进程先退出，那么这个子进程称之为 孤儿进程。
那么，祖先进程init 就会成为该子进程的父进程，回收该子进程的资源
*/int main(int argc, char **argv)
{printf(" main 当前进程的ID号:%d\n",getpid());pid_t id = fork();if(id >0)        //子进程{printf("[%d] 我是父进程 准备退出.....\n",getpid());sleep(5);}else if(id == 0) //子进程{sleep(25); //延时20s之后，父进程此时已经退出了，子进程变成了孤儿进程//孤儿进程 是 在失去 父进程的时候 马上 寻找继父printf("[%d] 我是儿子，准备退出....\n", getpid());printf("我的继父进程id:%d\n", getppid());}return 0;
}

程序运行结果：

通过 ps -ef 可以查看到，在父进程退出子进程成为孤儿进程后，由 /lib/systemd/systemd --user 进程进行了接管。

Snail@ubuntu:~/Desktop/demo$ ps -ef
UID          PID    PPID  C STIME TTY          TIME CMD
root           1       0  0 16:03 ?        00:00:03 /sbin/init auto noprompt
...
Snail       1613       1  0 16:07 ?        00:00:01 /lib/systemd/systemd --user
...
root        6919    1613  0 16:31 pts/2    00:00:00 ./sys_demo

3、僵尸进程

在Linux系统中，僵尸进程（Zombie Process）是指已经终止（结束运行）但其父进程尚未调用 wait() 或 waitpid() 系统调用来回收其资源的子进程。僵尸进程不占用CPU或内存资源，但会保留其进程描述符（Process Descriptor）在系统的进程表中，直到父进程处理其终止状态。

通俗易懂的话来说就是，父进程还存在，但是去做的别的事情了（比如在一个死循环，没有退出），此时子进程退出之后，就变成了僵尸进程。

（可以用ps -ef 查看，进程的状态栏为defunct，这就是所谓的“僵尸”进程）。

僵尸进程的特点：

不占用CPU或内存（已终止，仅保留进程表项）。
进程状态为 Z（Zombie）（可通过 ps 或 top 查看）。
无法被 kill 命令杀死（因为它已经是“死”进程，只能由父进程或 init 回收）。

僵尸进程产生的核心条件：

子进程先于父进程终止。
父进程未主动回收子进程。

僵尸进程程序示例：

#include<stdio.h>
#include <sys/types.h>
#include <unistd.h>/*
僵尸进程：父进程还存在，但是去做的别的事情了（比如在一个死循环，没有退出），
此时子进程退出之后，就变成了僵尸进程。
（可以用ps -ef 查看，进程的状态栏为defunct，这就是所谓的“僵尸”进程）*/int main()
{printf(" main 当前进程的ID号:%d\n",getpid());//创建一个子进程pid_t id = fork();if(id >0)             //父进程{while(1){sleep(1);printf("[%d] 我是你爹，但是我正在做别的事情.....\n",getpid());}}
else if(id == 0)    //子进程{printf("[%d]我是儿子，准备退出....\n",getpid());return 0;}return 0;
}

程序运行结果：

通过 ps -ef 可以查看到，在子进程退出后，因父进程迟迟未结束，且父进程未主动回收子进程，子进程变成了僵尸进程，进入了僵尸态。

Snail@ubuntu:~/Desktop/demo$ ps -ef
UID          PID    PPID  C STIME TTY          TIME CMD
root           1       0  0 16:03 ?        00:00:04 /sbin/init auto nopromp
...
Snail      10651    5605  0 17:27 pts/0    00:00:00 /usr/bin/bash --init-fi
...
Snail      10814   10651  0 17:27 pts/0    00:00:00 ./a.out
Snail      10815   10814  0 17:27 pts/0    00:00:00 [a.out] <defunct>

解决进程的僵尸态问题：

①、父进程还在，主动回收资源：

等待一个进程的目的就是帮这个进程修改状态 (从僵尸态变成死亡态)

阻塞回收：调用 wait( ) 或 waitpid( )

非阻塞回收：WNOHANG

②、父进程退出后，子进程会寻找继父帮自己回收资源：

验证父进程还在，但是不主动回收资源，结果就是这个子进程会一直等待父进程的退出之后，然后去寻找继父帮自己回收资源。

③、父进程忽略 SIGCHLD（自动回收）：

如果父进程不回收子进程且不忽略 SIGCHLD，子进程会保持僵尸状态。

直到：父进程终止时子进程被继父进程接管并回收或系统重启时所有进程被清理。