Skip to content

随机逼近

Stochastic Approximation

SA 指的是解决寻根(方程求解)或优化问题的一大类随机迭代算法。与许多其他寻根(方程求解)算法(如基于梯度的方法)相比,SA 的强大之处在于它不需要知道目标函数的表达式或其导数或者梯度的表达式。

均值估计(Mean Estimation)

在蒙特卡洛采样中:

E[X]x¯:=1Ni=1Nxi

如何计算平均值 x¯ ?

  • 收集所有样本,然后计算平均值。但这种方法必须等待样本收集完毕。
  • 迭代计算平均值。
wk+1=wk1k(wkxk)

有:

w1=0w2=w1(w1x1)=x1w3=12(x1+x2)w4=13(x1+x2+x3)wk+1=1ki=1kxi=1kx¯

进一步推广:

wk+1=wkαk(wkxk)

Robbins-Monro 算法

Robbins-Monro 算法是 随机逼近领域的开创性方法,由 Herbert Robbins 和 Sutton Monro 于 1951 年提出,用于解决无法直接观测目标函数的方程求根问题。该算法在统计学、机器学习和控制理论中有广泛应用。

对于方程 g(w)=0,假设最优解为 w

在噪声存在的情况下,通过迭代逐步逼近方程 g(w)=0 的解 w

wk+1=wkαk(g(wk)+ξk)

其中,wk 是对根的第 k 次估计,αk 是个正系数, 噪声 ξk 表示对真实函数 g(w) 观测时的随机误差。

算法收敛性依赖于以下条件:

  • 步长要求:
k=1αk=(允许充分探索)k=1αk2<(抑制噪声累积)

 常见选择:αk=c/k(c>0)

  • 函数性质:

g(w) 需满足:

0<c1wg(w)c2

 即函数单调且梯度有上下界。

  • 噪声条件:
E[ξkwk]=0E[ξk2wk]<

容易证明,均值分析方法得到的:

wk+1=wkαk(wkxk)

是一个特殊的 RM 算法。