当前位置: 首页 > news >正文

【Wasserstein-1 距离】

Wasserstein-1 距离

    • 🎯 公式写法
    • 🧠 直观理解
      • 🌍 地球搬运工距离(Earth Mover's Distance)
      • 🚚 数学语言说人话:
    • 💡 举个简单的例子(离散情况)
    • 🔍 为什么这对 GAN 很有用?
    • ✅ 总结一句话

这条公式是理解 WGAN 的关键之一,我们来 逐步展开解释这个 Wasserstein-1 距离的定义


🎯 公式写法

我们写得更清晰一点:

W ( P r , P g ) = inf ⁡ γ ∈ Π ( P r , P g ) E ( x , y ) ∼ γ [ ∥ x − y ∥ ] W(P_r, P_g) = \inf_{\gamma \in \Pi(P_r, P_g)} \mathbb{E}_{(x, y) \sim \gamma} \left[ \|x - y\| \right] W(Pr,Pg)=γΠ(Pr,Pg)infE(x,y)γ[xy]

其中:

  • P r P_r Pr 是真实数据的分布(real distribution)
  • P g P_g Pg 是生成器生成的数据分布(generator distribution)
  • γ \gamma γ 是连接 P r P_r Pr P g P_g Pg联合分布
  • Π ( P r , P g ) \Pi(P_r, P_g) Π(Pr,Pg) 表示所有边缘分布分别是 P r P_r Pr P g P_g Pg 的联合分布集合
  • ∥ x − y ∥ \|x - y\| xy 表示 x x x y y y 之间的距离(通常是 L2 范数)

🧠 直观理解

🌍 地球搬运工距离(Earth Mover’s Distance)

假设你是一个工头,要把一堆土(生成数据 P g P_g Pg)“搬运”成另一堆土(真实数据 P r P_r Pr)。

  • 每铲土从位置 y y y 搬到 x x x,你要付出的成本是 ∥ x − y ∥ \|x - y\| xy
  • 你要设计一种“搬法” γ \gamma γ,告诉你从哪搬到哪、搬多少(这就是联合分布)
  • 目标:在所有可能搬法 γ \gamma γ 中找到一种搬运成本最小的,称为 Wasserstein 距离

🚚 数学语言说人话:

  • γ \gamma γ” 就是 “我从生成样本 y y y 搬多少到真实样本 x x x
  • ∥ x − y ∥ \|x - y\| xy” 是每一笔运输的成本
  • E ( x , y ) ∼ γ [ ∥ x − y ∥ ] \mathbb{E}_{(x,y) \sim \gamma}[\|x - y\|] E(x,y)γ[xy]” 是所有搬运路线的总平均成本
  • inf ⁡ \inf inf” 表示在所有搬运方案中找最优那一个

💡 举个简单的例子(离散情况)

假设我们有两个分布(都是只有三个点):

  • P r P_r Pr: 在 x = 1 , 3 , 5 x=1, 3, 5 x=1,3,5 上各有 1 / 3 1/3 1/3 概率
  • P g P_g Pg: 在 x = 2 , 4 , 6 x=2, 4, 6 x=2,4,6 上各有 1 / 3 1/3 1/3 概率

为了“把 P g P_g Pg 搬成 P r P_r Pr”,你可以选择这样搬:

  • 2 2 2 搬到 1 1 1 (距离 1)
  • 4 4 4 搬到 3 3 3 (距离 1)
  • 6 6 6 搬到 5 5 5 (距离 1)

总成本是 3 × 1 3 × 1 = 1 3 \times \frac{1}{3} \times 1 = 1 3×31×1=1

于是 W ( P r , P g ) = 1 W(P_r, P_g) = 1 W(Pr,Pg)=1


🔍 为什么这对 GAN 很有用?

传统的 GAN 使用 JS 散度,它在分布没重叠时为常数,不能提供梯度。而 Wasserstein 距离:

  • 始终是连续、可微的
  • 即使分布没重叠,也能反映它们“有多远”
  • 所以训练更加稳定、易于收敛

✅ 总结一句话

Wasserstein 距离衡量的是“在最优搬运策略下,把一个分布变成另一个分布所需的最小平均代价”。

它是真正意义上能“感知分布距离”的度量,所以被 WGAN 用来替代 JS 散度,从而解决原始 GAN 的不稳定问题。

相关文章:

  • Spring Boot + ShardingSphere 分库分表实战:电商订单场景案例
  • cline 提示词工程指南-架构篇
  • 美团即时零售大动作,将独立的闪购将会改变什么?
  • UE5 设置父物体和解除父子关系(移除子物体)
  • 磁珠详解:特性参数、选型方法、厂商对比及与电感的区别
  • 【动手学强化学习】番外6-MAPPO应用框架学习
  • QT开发之Mysql数据库(一)
  • 赶集网(Python)
  • C++ 指针从入门到精通实战:全面掌握指针的概念与应用
  • 第六讲 | vector的使用及其模拟实现
  • 绿算轻舟系列FPGA加速卡:驱动数字化转型的核心动力
  • 敏感数据触发后怎么保障安全?
  • Windows10 微软五笔 造词造句
  • 矩阵求导 Ref 0
  • 跨境电商中的几种支付方式——T/T、L/C、D/P、D/A、O/A
  • 【新能源汽车压力采集与数据处理技术方案:从传感器到智能分析的硬核实战指南】
  • The first day of vue
  • openGauss新特性 | 自动参数化执行计划缓存
  • 三层架构与分层解耦:深入理解IOC与DI设计模式
  • 微信小程序实现table样式,自带合并行合并列
  • 海南儋州市委副书记任延新已赴市人大常委会履新
  • 四川邻水县县长石国平拟任县(市、区)党委书记
  • 5月动漫|“爱死机”即将回归,《明末》或是下一个大IP?
  • 讲座|现代女性在面对生育、事业与家庭之间的复杂抉择
  • 第三款在美获批的国产PD-1肿瘤药来了,影响多大?
  • 国务院同意在海南全岛和秦皇岛等15个城市(地区)设立跨境电子商务综合试验区