当前位置: 首页 > news >正文

考研数据结构之树与二叉树的应用:哈夫曼树、哈夫曼编码与并查集

考研数据结构之树与二叉树的应用:哈夫曼树、哈夫曼编码与并查集

树与二叉树不仅是数据结构的核心内容,其应用更是考研高频考点。本文聚焦哈夫曼树与哈夫曼编码(数据压缩)、并查集(动态连通性问题)两大应用,结合真题解析与代码实现,帮助考生深入掌握核心逻辑。


一、哈夫曼树与哈夫曼编码

1. 哈夫曼树的定义与构造

(1)基本概念
  • 带权路径长度(WPL):树中所有叶子节点的权值乘以其到根节点的路径长度之和。
  • 哈夫曼树(最优二叉树):给定一组权值,构造的WPL最小的二叉树。
    特点
    • 权值越大的节点离根节点越近。
    • 哈夫曼树不唯一,但WPL相同。
(2)构造算法

通过贪心策略逐步合并最小权值节点:

  1. 初始化:将每个权值视为独立节点,构成森林。
  2. 重复以下步骤直至只剩一棵树:
    • 从森林中选出两个权值最小的节点作为左右子树。
    • 创建新节点作为它们的父节点,权值为两子节点之和。
    • 将新节点加入森林。

示例
权值集合{5, 3, 8, 2}的构造过程:

Step 1: 选2和3 → 合并为5  
Step 2: 选5和5 → 合并为10  
Step 3: 合并10和8 → 最终WPL = 2*3 + 3*3 + 5*2 + 8*1 = 39

2. 哈夫曼编码

(1)编码规则
  • 前缀编码:任一字符的编码都不是其他字符编码的前缀。
  • 构造方法
    • 左分支标记为0,右分支标记为1
    • 从根到叶子节点的路径即为该字符的编码。

示例
对字符A(5), B(3), C(8), D(2)构造编码:

哈夫曼树结构:  18/    \8      10/  \5    5/ \2   3
编码结果:  
D: 00, B: 01, A: 10, C: 1
(2)应用:数据压缩
  • 压缩原理:高频字符用短编码,低频字符用长编码,减少总存储空间。
  • 实际案例:BMP图片压缩中,统计各字节频率后构造哈夫曼编码,实现无损压缩。

3. 代码实现(C语言)

// 哈夫曼树节点定义
typedef struct HuffmanNode {int weight;struct HuffmanNode *lchild, *rchild;
} HuffmanNode;// 构造哈夫曼树
HuffmanNode* BuildHuffman(int weights[], int n) {// 使用优先队列(最小堆)实现// 伪代码:循环取最小两个节点合并,直至剩一个节点
}

二、并查集(Union-Find)

1. 数据结构与操作

(1)核心思想
  • 父节点数组:用数组记录每个节点的父节点,根节点的父节点为自身。
  • 路径压缩:查找时将路径上的节点直接指向根节点,优化后续操作。
(2)基本操作
  • Find:查找节点的根(递归或迭代实现)。
  • Union:合并两个集合(按秩合并或简单合并)。

代码示例

int parent[MAX]; // 父节点数组int Find(int x) {if (parent[x] != x) parent[x] = Find(parent[x]); // 路径压缩return parent[x];
}void Union(int x, int y) {int rootX = Find(x), rootY = Find(y);if (rootX != rootY) parent[rootY] = rootX; // 简单合并
}

2. 应用场景

  • 动态连通性问题:如判断图中是否存在环(Kruskal算法)。
  • 社交网络:快速判断两人是否属于同一群体。

三、真题解析

1. 哈夫曼编码计算

题目(2023年真题,):

给定字符集{A, B, C, D}的频率为{5, 15, 45, 35},构造哈夫曼编码,并计算WPL。

解析

  1. 构造哈夫曼树
    • 合并5和15 → 20
    • 合并20和35 → 55
    • 合并55和45 → 100
  2. 编码结果
    • A: 000, B: 001, C: 1, D: 01
  3. WPL5*3 + 15*3 + 45*1 + 35*2 = 205

2. 并查集时间复杂度

题目(经典真题,):

若并查集采用路径压缩和按秩合并优化,其FindUnion操作的时间复杂度是多少?

答案
均摊时间复杂度为O(α(n)),其中α(n)是阿克曼函数的反函数,可视为常数。


四、总结

  • 哈夫曼树贪心算法的典型应用,需掌握构造步骤与WPL计算。
  • 并查集通过路径压缩按秩合并实现高效动态连通性判断。
  • 两者在数据压缩(哈夫曼编码)和图算法(Kruskal)中均有重要实践价值。

相关文章:

  • JavaWeb开发 Servlet底层 从概念到HTTP请求 到web服务器再到servlet
  • ROS2 常用
  • How to run ERSEM
  • linux上安装vimplus 从零开始
  • 使用Python构建桌面图片浏览器
  • cursor如何回退一键回退多个文件的修改
  • Docker 安装 Elasticsearch 8.x
  • Java二叉树深度解析:结构、算法与应用实践指南
  • 【教程】检查RDMA网卡状态和测试带宽 | 附测试脚本
  • Java公平锁和非公平锁实现原理
  • 图论-BFS搜索图/树-最短路径问题的解决
  • 2025 cs144 Lab Checkpoint 2 小白超详细版
  • python 安装win32com.client库
  • ReportLab 导出 PDF(文档创建)
  • vue里provide作用:将一组全局方法注入到 Vue 应用的所有子组件中
  • 【正点原子STM32MP257连载】第四章 ATK-DLMP257B功能测试——USB测试 #USB HOST #USB 鼠标
  • 京东硬核挑战潜规则,外卖算法要变天?
  • 阶段性使用总结-通义灵码
  • 协程从原理到最新的c++协程特性
  • 从服务器多线程批量下载文件到本地
  • 对话|棋后居文君:创造历史之后,还有继续追梦的心
  • 中共中央台办、国务院台办在南京举办台商代表座谈会
  • 2月美国三大债主均增持美国国债,中国增持235亿美元
  • 东南亚三国行第三日|中马将在人工智能、大熊猫保护、铁路等多领域深化合作
  • 夜读丨惊春谁似我
  • 男子手拎981株罂粟苗入境云南被查,清点时铺满海关查验台