当前位置：首页 > news >正文

【每天一个知识点】熵（Entropy）

news 来源：原创 2025/4/25 12:31:54

“熵（Entropy）”是信息论、热力学、机器学习等多个领域的核心概念。它可以用一句话概括为：

🔑 熵表示系统的不确定性或信息混乱程度。

📚 一、信息论中的熵（Information Entropy）

在 Claude Shannon 的信息论中，熵衡量的是消息来源的平均信息量，也可视为我们从一个系统中获得的信息的不确定性。

📐 数学定义（离散情形）

设一个离散随机变量 XX 的概率分布为 p(x)p(x)，则其熵定义为：

单位是 bit（比特）
如果某事件越不确定（概率越小），它的信息量越大
如果所有事件概率一致（最混乱），熵最大

🌰 举个例子：

抛一个公平的硬币：
如果硬币总是正面，熵为 0（完全确定）

🔍 二、熵的图解理解

想象你要猜一个盒子里藏的是哪种球：

如果盒子中是 50% 红球 + 50% 蓝球 → 熵高，难猜
如果是 100% 红球 → 熵低，容易猜

📊 三、机器学习中的熵应用

1. 决策树中的信息增益（Information Gain）

熵用来衡量特征对数据分类的不确定性减少程度
决策树（如 ID3、C4.5）使用“熵下降”来选择分裂特征

2. 聚类/聚合中的熵损失

在聚类或分类时，类别越“纯”，熵越小
可用于聚类质量评估、联合聚类中的信息一致性判断

3. 表征多样性、熵正则化

在深度学习中，用熵来鼓励输出分布多样性（如GAN中的判别器）
熵小：模型过度自信；熵大：模型不确定性强

🔁 四、与其他概念对比

概念	定义	与熵的关系
信息量（Information Content）	I(x)=−log⁡p(x)I(x) = -\log p(x)	熵是信息量的期望
交叉熵（Cross Entropy）	比较两个分布的平均编码代价	包含熵 + KL散度
KL散度（相对熵）	度量两个分布的差异	是熵差的一部分

🧠 五、直观理解

场景	熵高还是低？
完全随机的骰子	熵高（最大）
只出某一个点的骰子	熵低（最小）
80% 是某一个结果	熵中等偏低

相关文章：

SpringBoot入门实战（项目搭建、配置、功能接口实现等一篇通关）

【KWDB 创作者计划】_上位机知识篇---Github

什么是公链?公链项目有哪些?公链项目开发

【OSG学习笔记】Day 8: 纹理贴图——赋予模型细节

vue2项目，为什么开发环境打包出来的js文件名是1.js 2.js，而生产环境打包出来的是chunk-3adddd.djncjdhcbhdc.js

头歌之动手学人工智能-机器学习 --- PCA

SIGGRAPH投稿相关官方指导

Python 读取 txt 文件详解 with ... open()

Python torchvision.datasets 下常用数据集配置和使用方法

如何根据需求选择合适的氢气监测分析仪？

C++ Lambda 表达式

24FIC 决赛计算机部分

SAP SuccessFactors Recruiting and Onboarding The Comprehensive Guide

[250423] Caddy 2.10 正式发布：引入 ECH、后量子加密等重要更新

基于javaweb的SpringBoot校园服务平台系统设计与实现(源码+文档+部署讲解）

差分探头关键性能参数解析

【Python语言基础】24、并发编程

单片机 + 图像处理芯片 + TFT彩屏触摸滑动条控件

github 简单访问方法(无魔法)

YOLOv8 涨点新方案：SlideLoss FocalLoss 优化，小目标检测效果炸裂！

石磊当选河北秦皇岛市市长

中国驻英国大使郑泽光：中国反制美国关税是为了维护国际公平正义和多边贸易体制

技术派｜“会飞的手榴弹”：微型无人机将深刻改变单兵作战方式

加拿大财长：加拿大需要抗击美国关税

上海：全面建设重复使用火箭创新高地、低成本商业卫星规模制造高地

“全国十大考古”揭晓：盘龙城遗址、周原遗址等入选