当前位置: 首页 > news >正文

【每天一个知识点】熵(Entropy)

熵(Entropy)”是信息论、热力学、机器学习等多个领域的核心概念。它可以用一句话概括为:

🔑 熵表示系统的不确定性或信息混乱程度。


📚 一、信息论中的熵(Information Entropy)

在 Claude Shannon 的信息论中,熵衡量的是消息来源的平均信息量,也可视为我们从一个系统中获得的信息的不确定性。

📐 数学定义(离散情形)

设一个离散随机变量 XX 的概率分布为 p(x)p(x),则其熵定义为:

  • 单位是 bit(比特)

  • 如果某事件越不确定(概率越小),它的信息量越大

  • 如果所有事件概率一致(最混乱),熵最大

🌰 举个例子:

  • 抛一个公平的硬币:

  • 如果硬币总是正面,熵为 0(完全确定)


🔍 二、熵的图解理解

想象你要猜一个盒子里藏的是哪种球:

  • 如果盒子中是 50% 红球 + 50% 蓝球 → 熵高,难猜

  • 如果是 100% 红球 → 熵低,容易猜


📊 三、机器学习中的熵应用

1. 决策树中的信息增益(Information Gain)

  • 熵用来衡量特征对数据分类的不确定性减少程度

  • 决策树(如 ID3、C4.5)使用“熵下降”来选择分裂特征

2. 聚类/聚合中的熵损失

  • 在聚类或分类时,类别越“纯”,熵越小

  • 可用于聚类质量评估、联合聚类中的信息一致性判断

3. 表征多样性、熵正则化

  • 在深度学习中,用熵来鼓励输出分布多样性(如GAN中的判别器)

  • 熵小:模型过度自信;熵大:模型不确定性强


🔁 四、与其他概念对比

概念定义与熵的关系
信息量(Information Content)I(x)=−log⁡p(x)I(x) = -\log p(x)熵是信息量的期望
交叉熵(Cross Entropy)比较两个分布的平均编码代价包含熵 + KL散度
KL散度(相对熵)度量两个分布的差异是熵差的一部分

🧠 五、直观理解

场景熵高还是低?
完全随机的骰子熵高(最大)
只出某一个点的骰子熵低(最小)
80% 是某一个结果熵中等偏低

相关文章:

  • SpringBoot入门实战(项目搭建、配置、功能接口实现等一篇通关)
  • 【KWDB 创作者计划】_上位机知识篇---Github
  • 什么是公链?公链项目有哪些?公链项目开发
  • 【OSG学习笔记】Day 8: 纹理贴图——赋予模型细节
  • vue2项目,为什么开发环境打包出来的js文件名是1.js 2.js,而生产环境打包出来的是chunk-3adddd.djncjdhcbhdc.js
  • 头歌之动手学人工智能-机器学习 --- PCA
  • SIGGRAPH投稿相关官方指导
  • Python 读取 txt 文件详解 with ... open()
  • Python torchvision.datasets 下常用数据集配置和使用方法
  • 如何根据需求选择合适的氢气监测分析仪?
  • C++ Lambda 表达式
  • 24FIC 决赛 计算机部分
  • SAP SuccessFactors Recruiting and Onboarding The Comprehensive Guide
  • [250423] Caddy 2.10 正式发布:引入 ECH、后量子加密等重要更新
  • 基于javaweb的SpringBoot校园服务平台系统设计与实现(源码+文档+部署讲解)
  • 差分探头关键性能参数解析
  • 【Python语言基础】24、并发编程
  • 单片机 + 图像处理芯片 + TFT彩屏 触摸滑动条控件
  • github 简单访问方法(无魔法)
  • YOLOv8 涨点新方案:SlideLoss FocalLoss 优化,小目标检测效果炸裂!
  • 石磊当选河北秦皇岛市市长
  • 中国驻英国大使郑泽光:中国反制美国关税是为了维护国际公平正义和多边贸易体制
  • 技术派|“会飞的手榴弹”:微型无人机将深刻改变单兵作战方式
  • 加拿大财长:加拿大需要抗击美国关税
  • 上海:全面建设重复使用火箭创新高地、低成本商业卫星规模制造高地
  • “全国十大考古”揭晓:盘龙城遗址、周原遗址等入选