随机过程,相关函数的一个例题|柯尔莫哥洛夫存在定理
问题描述
我们有两个周期为 L L L 的函数 g 1 ( t ) g_1(t) g1(t) 和 g 2 ( t ) g_2(t) g2(t),并定义随机过程:
X ( t ) = g 1 ( t + ε ) , Y ( t ) = g 2 ( t + ε ) , X(t) = g_1(t + \varepsilon), \quad Y(t) = g_2(t + \varepsilon), X(t)=g1(t+ε),Y(t)=g2(t+ε),其中 ε \varepsilon ε 是一个均匀分布在 [ 0 , L ] [0, L] [0,L] 上的随机变量,即 ε ∼ U ( 0 , L ) \varepsilon \sim U(0, L) ε∼U(0,L)。目标是求它们的互相关函数:
R X Y ( t , t + τ ) = E [ X ( t ) Y ( t + τ ) ] . R_{XY}(t, t + \tau) = E[X(t)Y(t + \tau)]. RXY(t,t+τ)=E[X(t)Y(t+τ)].
分步解析
1. 互相关函数的定义
互相关函数 R X Y ( t , t + τ ) R_{XY}(t, t + \tau) RXY(t,t+τ) 衡量的是 X ( t ) X(t) X(t) 和 Y ( t + τ ) Y(t + \tau) Y(t+τ) 之间的相关性,定义为:
R X Y ( t , t + τ ) = E [ X ( t ) Y ( t + τ ) ] . R_{XY}(t, t + \tau) = E[X(t)Y(t + \tau)]. RXY(t,t+τ)=E[X(t)Y(t+τ)].代入 X ( t ) X(t) X(t) 和 Y ( t ) Y(t) Y(t) 的表达式:
= E [ g 1 ( t + ε ) g 2 ( t + τ + ε ) ] . = E[g_1(t + \varepsilon) g_2(t + \tau + \varepsilon)]. =E[g1(t+ε)g2(t+τ+ε)].
2. 期望的计算
因为 ε \varepsilon ε 是随机变量,我们需要对 ε \varepsilon ε 的所有可能值求期望。由于 ε ∼ U ( 0 , L ) \varepsilon \sim U(0, L) ε∼U(0,L),其概率密度函数为:
f ε ( x ) = { 1 L 如果 x ∈ [ 0 , L ] , 0 其他情况 . f_\varepsilon(x) = \begin{cases} \frac{1}{L} & \text{如果 } x \in [0, L], \\ 0 & \text{其他情况}. \end{cases} fε(x)={L10如果 x∈[0,L],其他情况.因此,期望可以表示为积分:
E [ g 1 ( t + ε ) g 2 ( t + τ + ε ) ] = ∫ − ∞ ∞ g 1 ( t + x ) g 2 ( t + τ + x ) f ε ( x ) d x . E[g_1(t + \varepsilon) g_2(t + \tau + \varepsilon)] = \int_{-\infty}^{\infty} g_1(t + x) g_2(t + \tau + x) f_\varepsilon(x) \, dx. E[g1(t+ε)g2(t+τ+ε)]=∫−∞∞g1(t+x)g2(t+τ+x)fε(x)dx.由于 f ε ( x ) f_\varepsilon(x) fε(x) 只在 [ 0 , L ] [0, L] [0,L] 上非零,积分限可以缩减:
= 1 L ∫ 0 L g 1 ( t + x ) g 2 ( t + τ + x ) d x . = \frac{1}{L} \int_{0}^{L} g_1(t + x) g_2(t + \tau + x) \, dx. =L1∫0Lg1(t+x)g2(t+τ+x)dx.
3. 变量替换
为了简化积分,做变量替换:
v = t + x ⇒ d v = d x . v = t + x \quad \Rightarrow \quad dv = dx. v=t+x⇒dv=dx.当 x = 0 x = 0 x=0, v = t v = t v=t;当 x = L x = L x=L, v = t + L v = t + L v=t+L。因此积分变为:
= 1 L ∫ t t + L g 1 ( v ) g 2 ( v + τ ) d v . = \frac{1}{L} \int_{t}^{t + L} g_1(v) g_2(v + \tau) \, dv. =L1∫tt+Lg1(v)g2(v+τ)dv.
4. 利用周期性化简
由于 g 1 g_1 g1 和 g 2 g_2 g2 是周期为 L L L 的函数,积分区间 [ t , t + L ] [t, t + L] [t,t+L] 的长度刚好是一个周期。因此,积分结果与起始点 t t t 无关,可以平移积分区间到 [ 0 , L ] [0, L] [0,L]:
= 1 L ∫ 0 L g 1 ( v ) g 2 ( v + τ ) d v . = \frac{1}{L} \int_{0}^{L} g_1(v) g_2(v + \tau) \, dv. =L1∫0Lg1(v)g2(v+τ)dv.
5. 最终结果
因此,互相关函数为:
R X Y ( t , t + τ ) = 1 L ∫ 0 L g 1 ( v ) g 2 ( v + τ ) d v . R_{XY}(t, t + \tau) = \frac{1}{L} \int_{0}^{L} g_1(v) g_2(v + \tau) \, dv. RXY(t,t+τ)=L1∫0Lg1(v)g2(v+τ)dv.
关键点总结
- 随机变量的期望:通过积分计算,利用 ε \varepsilon ε 的均匀分布性质。
- 变量替换:将积分变量从 x x x 换为 v = t + x v = t + x v=t+x,简化被积函数。
- 周期性:积分区间长度为一个周期时,结果与起始点无关,因此可以平移至 [ 0 , L ] [0, L] [0,L]。
- 最终形式:互相关函数仅依赖于时间差 τ \tau τ,与具体时间 t t t 无关,体现了平稳性。
直观理解
- 物理意义:互相关函数衡量的是两个信号 g 1 g_1 g1 和 g 2 g_2 g2 在时间偏移 τ \tau τ 后的相似性。
- 均匀相位: ε \varepsilon ε 的均匀分布表示信号的起始相位是完全随机的,因此互相关函数是对所有可能相位的平均。
举例验证
假设 g 1 ( t ) = cos ( 2 π t L ) g_1(t) = \cos\left(\frac{2\pi t}{L}\right) g1(t)=cos(L2πt), g 2 ( t ) = sin ( 2 π t L ) g_2(t) = \sin\left(\frac{2\pi t}{L}\right) g2(t)=sin(L2πt),则:
R X Y ( τ ) = 1 L ∫ 0 L cos ( 2 π v L ) sin ( 2 π ( v + τ ) L ) d v . R_{XY}(\tau) = \frac{1}{L} \int_{0}^{L} \cos\left(\frac{2\pi v}{L}\right) \sin\left(\frac{2\pi (v + \tau)}{L}\right) \, dv. RXY(τ)=L1∫0Lcos(L2πv)sin(L2π(v+τ))dv.利用三角恒等式可以进一步化简,结果将是一个关于 τ \tau τ 的函数,与 t t t 无关。
柯尔莫哥洛夫存在定理:用“乐高积木”理解随机过程的构建
1. 一句话核心思想
柯尔莫哥洛夫存在定理告诉我们:
只要给出一组“自洽的局部描述”(有限维分布族),就一定能构造出一个完整的随机过程,使得这些局部描述是它的“切片”。
就像用乐高积木的局部拼装规则,还原出整个宇宙!
2. 拆解定理中的关键概念
(1) 参数集T
- 是什么:随机过程的“时间”或“索引”集合。
- 例子:
- 离散时间:T = {1, 2, 3, …}(如股票每日价格)。
- 连续时间:T = [0, ∞)(如布朗运动)。
- 例子:
(2) 有限维分布族F
- 是什么:所有可能的“有限点联合分布”的集合。
- 例子:对时间点 t₁, t₂, t₃,F 定义了 P(X(t₁)≤a, X(t₂)≤b, X(t₃)≤c)。
- 要求:
- 对称性:交换顺序不影响分布(如 P(X(t₁), X(t₂)) = P(X(t₂), X(t₁)))。
- 相容性:高维分布“投影”到低维时一致(如 P(X(t₁)) 是 P(X(t₁), X(t₂)) 的边缘分布)。
(3) 概率空间(Ω, ℱ, P)
- Ω:所有可能的“随机过程路径”的集合(如所有可能的股价走势图)。
- ℱ:可以测量的事件(如“股价在t=1时超过100”是否合法)。
- P:给事件分配概率的规则。
3. 定理的直观意义
想象你要设计一个“随机股价生成器”:
- 输入:
- 用户提供所有“两天股价联合分布”“三天股价联合分布”等(有限维分布族F)。
- 这些分布必须不自相矛盾(如两天的分布和三天分布中“前两天的部分”要一致)。
- 输出:
- 定理保证:存在一个完整的随机过程,它的所有有限时间点的行为完全符合用户提供的分布。
类比:
- 有限维分布 → 乐高积木的局部拼装说明书。
- 随机过程 → 按说明书拼出的完整乐高宇宙。
4. 为什么需要这个定理?
- 实际问题:我们通常只能观测或定义有限时间点的联合分布(如股票两天的相关性),但需要研究整个连续过程。
- 数学难题:无限维空间极其复杂,直接定义“所有时间点的联合分布”几乎不可能。
- 定理的价值:通过有限维分布“间接”构造无限维过程,绕开了直接处理的困难。
5. 经典应用例子
(1) 布朗运动(Wiener过程)
- 有限维分布:任意时间点的增量服从正态分布,且独立。
- 定理保证:存在一个连续路径的随机过程(即布朗运动)满足这些局部性质。
(2) 高斯过程
- 通过均值和协方差函数(有限维分布的性质)定义整个过程。
6. 可能的误区
- 误区1:“有限维分布能唯一确定随机过程。”
- 实际上,路径性质(如连续性)可能需要额外约定。
- 误区2:“定理直接给出了显式构造。”
- 定理是非构造性的,只证明存在性,实际构造需其他方法(如Kolmogorov连续性定理)。
7. 总结
- 柯尔莫哥洛夫存在定理是概率论的“基石”之一,它像一座桥,连接了:
- 局部(有限维分布) ←→ 全局(随机过程)。
- 核心价值:只要局部规则一致,全局对象一定存在。
- 应用场景:所有需要从有限数据定义无限过程的领域(如金融、物理、机器学习中的高斯过程)。
一句话:
“如果你能清晰描述所有有限的‘切片’,那么宇宙一定会帮你拼出完整的‘蛋糕’!”
相容性:用“照片拼图”理解概率分布的一致性
1. 一句话解释
相容性的意思是:
“高维分布(更多时间点的联合分布)必须兼容低维分布(更少时间点的分布),不能自相矛盾。”
就像你拍了一张全家福(高维),从中裁剪出单人照(低维)时,必须和之前单独拍的个人照一致!
2. 公式的直观理解
公式:
[
F_{t_1,\cdots,t_m}(x_1,\cdots,x_m) = F_{t_1,\cdots,t_m,\cdots,t_n}(x_1,\cdots,x_m, +\infty,\cdots,+\infty) \quad (m < n)
]
- 左边:(m) 个时间点(如 (t_1, t_2))的联合分布。
- 右边:(n) 个时间点(如 (t_1, t_2, \dots, t_5))的联合分布中,忽略多余的时间点(将 (x_{m+1}, \dots, x_n) 设为 (+\infty),即“不考虑这些点的约束”)。
关键:两边的结果必须完全一致!
3. 举个实际例子
场景:研究股票价格在周一、周三、周五的联合波动。
- 低维分布((m=2)):
(F_{周一, 周三}(x_1, x_2)) = P(周一价格 ≤ x₁, 周三价格 ≤ x₂)。 - 高维分布((n=3)):
(F_{周一, 周三, 周五}(x_1, x_2, +\infty)) = P(周一 ≤ x₁, 周三 ≤ x₂, 周五任意)。
相容性要求:
[
F_{周一, 周三}(x_1, x_2) = F_{周一, 周三, 周五}(x_1, x_2, +\infty)
]
即“加入周五的数据后,周一和周三的分布关系不能变”!
4. 为什么需要相容性?
- 避免矛盾:如果高维分布和低维分布对同一组变量的描述不同,概率模型会自相矛盾。
- 比如:
- 低维说“周一和周三正相关”,但高维说“周一和周三独立”,这就乱套了!
- 比如:
- 构造随机过程的基础:柯尔莫哥洛夫定理要求所有有限维分布“无缝拼接”,才能保证无限维过程的存在。
5. 类比:天气预报的兼容性
- 今天和明天的联合预报(高维):
“今天下雨且明天下雨的概率是30%。” - 今天的单独预报(低维):
“今天下雨的概率是40%。” - 相容性检查:
如果从联合预报中“忽略明天”(即明天下雨或不下雨都算),今天下雨的概率必须还是40%!- 若联合预报中“今天下雨”的概率变成35%,就违背相容性。
6. 数学本质:边缘分布的一致性
相容性本质是高维分布的边缘化必须等于低维分布。
- 边缘化 = 对其他变量积分(或求和)消去它们。
- 公式中设 (x_{m+1}=+\infty) 相当于对多余变量积分到最大值。
7. 总结
- 相容性是概率分布的“自洽性检查”,确保不同维度的分布描述同一件事时结果一致。
- 核心逻辑:
“如果你描述了一部分(低维),那么更复杂的描述(高维)必须兼容它,不能打架。” - 应用:所有涉及随机过程建模的领域(如金融、气象、信号处理)。
一句话记住:
“高维照片裁剪后,必须和原来拍的低维照片一致!”