当前位置: 首页 > news >正文

瓦瑟斯坦差分隐私中命题7对总变差TV的应用

在这里插入图片描述


公式36到37的推导过程详解

1. 总变差(Total Variation, TV)的定义

总变差距离是衡量两个概率分布 P P P Q Q Q 差异的一种方式,其定义为:
∥ P − Q ∥ T V = sup ⁡ A ∣ P ( A ) − Q ( A ) ∣ , \|P - Q\|_{TV} = \sup_{A} |P(A) - Q(A)|, PQTV=AsupP(A)Q(A),
即对所有可能事件 A A A,两分布概率差的最大绝对值。
另一种等价形式是:
∥ P − Q ∥ T V = 1 2 ∫ ∣ p ( x ) − q ( x ) ∣ d x , \|P - Q\|_{TV} = \frac{1}{2} \int |p(x) - q(x)| \, dx, PQTV=21p(x)q(x)dx,
即两分布密度函数 p ( x ) p(x) p(x) q ( x ) q(x) q(x)L1 范数 的一半。

2. 总变差与耦合(Coupling)的关系

耦合定理指出,总变差距离等于在所有可能的联合分布(耦合)中,随机变量 X X X Y Y Y 不相等的 最小概率
inf ⁡ X ∼ P Y ∼ Q E [ 1 X ≠ Y ] = ∥ P − Q ∥ T V . \inf_{\substack{X \sim P \\ Y \sim Q}} \mathbb{E}[1_{X \neq Y}] = \|P - Q\|_{TV}. XPYQinfE[1X=Y]=PQTV.
这里的下确界( inf ⁡ \inf inf)表示寻找最优的联合分布 γ ( X , Y ) \gamma(X, Y) γ(X,Y),使得 X ≠ Y X \neq Y X=Y 的概率最小。


3. 公式36到37的推导步骤

给定公式36:
Δ p f ⋅ inf ⁡ X ∼ Lap ( 0 , λ ) Y ∼ Lap ( Δ p f , λ ) [ E [ 1 X ≠ Y ] ] 1 / μ , \Delta_p f \cdot \inf_{\substack{X \sim \text{Lap}(0, \lambda) \\ Y \sim \text{Lap}(\Delta_p f, \lambda)}} \left[ \mathbb{E}[1_{X \neq Y}] \right]^{1/\mu}, ΔpfXLap(0,λ)YLap(Δpf,λ)inf[E[1X=Y]]1/μ,
目标是将其转换为总变差形式。

步骤1:应用耦合定理

根据耦合定理,对拉普拉斯分布 P = Lap ( 0 , λ ) P = \text{Lap}(0, \lambda) P=Lap(0,λ) Q = Lap ( Δ p f , λ ) Q = \text{Lap}(\Delta_p f, \lambda) Q=Lap(Δpf,λ),有:
inf ⁡ X ∼ P Y ∼ Q E [ 1 X ≠ Y ] = ∥ P − Q ∥ T V . \inf_{\substack{X \sim P \\ Y \sim Q}} \mathbb{E}[1_{X \neq Y}] = \|P - Q\|_{TV}. XPYQinfE[1X=Y]=PQTV.
因此,公式36中的下确界部分可替换为总变差距离:
Δ p f ⋅ ( ∥ P − Q ∥ T V ) 1 / μ . \Delta_p f \cdot \left( \|P - Q\|_{TV} \right)^{1/\mu}. Δpf(PQTV)1/μ.

步骤2:总变差的具体计算

对于两个拉普拉斯分布 P = Lap ( a , λ ) P = \text{Lap}(a, \lambda) P=Lap(a,λ) Q = Lap ( b , λ ) Q = \text{Lap}(b, \lambda) Q=Lap(b,λ),其密度函数为:
p ( x ) = 1 2 λ e − ∣ x − a ∣ / λ , q ( x ) = 1 2 λ e − ∣ x − b ∣ / λ . p(x) = \frac{1}{2\lambda} e^{-|x - a|/\lambda}, \quad q(x) = \frac{1}{2\lambda} e^{-|x - b|/\lambda}. p(x)=2λ1exa∣/λ,q(x)=2λ1exb∣/λ.
总变差距离可通过积分计算:
∥ P − Q ∥ T V = 1 2 ∫ − ∞ ∞ ∣ p ( x ) − q ( x ) ∣ d x . \|P - Q\|_{TV} = \frac{1}{2} \int_{-\infty}^\infty |p(x) - q(x)| \, dx. PQTV=21p(x)q(x)dx.
a = 0 a = 0 a=0 b = Δ p f b = \Delta_p f b=Δpf 时,计算得:
∥ P − Q ∥ T V = 1 2 ( 1 − e − Δ p f / λ ) . \|P - Q\|_{TV} = \frac{1}{2} \left( 1 - e^{-\Delta_p f / \lambda} \right). PQTV=21(1eΔpf/λ).
(具体推导需展开积分,此处直接给出结果。)

步骤3:代入公式36

将总变差结果代入公式36,得到:
Δ p f ⋅ ( 1 2 ( 1 − e − Δ p f / λ ) ) 1 / μ . \Delta_p f \cdot \left( \frac{1}{2} \left( 1 - e^{-\Delta_p f / \lambda} \right) \right)^{1/\mu}. Δpf(21(1eΔpf/λ))1/μ.
这对应公式37的形式:
1 2 Δ p f ⋅ ( ∥ Lap ( 0 , λ ) − Lap ( Δ p f , λ ) ∥ T V ) 1 / μ . \frac{1}{2} \Delta_p f \cdot \left( \| \text{Lap}(0, \lambda) - \text{Lap}(\Delta_p f, \lambda) \|_{TV} \right)^{1/\mu}. 21Δpf(Lap(0,λ)Lap(Δpf,λ)TV)1/μ.


4. 关键点解释

(1) 为什么总变差出现在公式中?
  • 总变差距离直接量化了两个分布的“最大局部差异”,而公式36中的 inf ⁡ E [ 1 X ≠ Y ] \inf \mathbb{E}[1_{X \neq Y}] infE[1X=Y] 本质是寻找最耦合下 X ≠ Y X \neq Y X=Y 的最小概率,这与总变差定义一致。
(2) 为什么有系数 1 2 \frac{1}{2} 21
  • 总变差的积分定义中包含了 1 2 \frac{1}{2} 21,这是为了归一化结果,使其落在 [ 0 , 1 ] [0, 1] [0,1] 范围内。
(3) 拉普拉斯分布的敏感性 Δ p f \Delta_p f Δpf
  • Δ p f \Delta_p f Δpf l p l_p lp-敏感度,表示在相邻数据集上函数 f f f 输出的最大 l p l_p lp 范数差。此处用于调整拉普拉斯分布的均值偏移,以反映数据隐私保护中的噪声尺度。

5. 总变差与其他散度的对比

散度类型定义特点
总变差 1 2 ∫ ∣ p − q ∣ d x \frac{1}{2} \int |p - q| dx 21pqdx几何直观,但对高维分布计算困难。
KL散度 ∫ p log ⁡ p q d x \int p \log \frac{p}{q} dx plogqpdx不对称,对无重叠分布发散。
Wasserstein最小运输成本几何敏感,但对计算资源要求较高。

总结

公式36到37的推导核心在于:

  1. 通过 耦合定理 inf ⁡ E [ 1 X ≠ Y ] \inf \mathbb{E}[1_{X \neq Y}] infE[1X=Y] 转化为总变差距离。
  2. 计算拉普拉斯分布的总变差,并引入敏感度 Δ p f \Delta_p f Δpf 调整噪声分布。
  3. 最终将结果表示为总变差的函数形式,为后续隐私分析(如差分隐私)提供理论基础。

相关文章:

  • yarn的介绍与操作,yarn和npm的选择
  • WPF特性分析
  • 网络应用程序体系结构
  • 【Vue3 / TypeScript】 项目兼容低版本浏览器的全面指南
  • lspci的资料
  • Win10一体机(MES电脑设置上电自动开机)
  • Google 开发者政策中心 - 3 月版
  • 神经网络的 “成长密码”:正向传播与反向传播深度解析(四)
  • k8s的yaml文件里的volume跟volumeMount的区别
  • 【飞渡科技数字孪生虚拟环境部署与集成教程 - CloudMaster实战指南】
  • 【基于SprintBoot+Mybatis+Mysql】电脑商城项目之显示勾选的购物车数据和创建订单
  • spark和Hadoop之间的对比和联系
  • 【C++】特殊类的设计、单例模式以及Cpp类型转换
  • 明远智睿2351开发板四核1.4G Linux处理器:驱动创新的引擎
  • 实现鼠标拖拽图片效果
  • 搜索引擎的高级语法
  • 【Spring】单例模式的创建方式(Bean解析)
  • 并发设计模式实战系列(3):工作队列
  • 【后端】构建简洁的音频转写系统:基于火山引擎ASR实现
  • C# 实现TCP/IP通信协议——Message结构设计
  • 事故调查报告:东莞一大楼装修项目去年致1人死亡,系违规带电作业
  • 支持医企协同创新研究,上海已设立一系列产学研医融合项目
  • 根据学习教育安排,上海市委中心组专题学习总书记力戒形式主义官僚主义重要论述
  • 跑马,一场对机器人的长测试
  • 中物联声明:反对美对华物流、海事和造船领域301调查措施
  • 白兰花香飘京城,上海文化体验项目点亮中华民族共同体之美