随机逼近
Stochastic Approximation
SA 指的是解决寻根(方程求解)或优化问题的一大类随机迭代算法。与许多其他寻根(方程求解)算法(如基于梯度的方法)相比,SA 的强大之处在于它不需要知道目标函数的表达式或其导数或者梯度的表达式。
均值估计(Mean Estimation)
在蒙特卡洛采样中:
如何计算平均值
- 收集所有样本,然后计算平均值。但这种方法必须等待样本收集完毕。
- 迭代计算平均值。
有:
进一步推广:
Robbins-Monro 算法
Robbins-Monro 算法是 随机逼近领域的开创性方法,由 Herbert Robbins 和 Sutton Monro 于 1951 年提出,用于解决无法直接观测目标函数的方程求根问题。该算法在统计学、机器学习和控制理论中有广泛应用。
对于方程
在噪声存在的情况下,通过迭代逐步逼近方程
其中,
算法收敛性依赖于以下条件:
- 步长要求:
常见选择:
- 函数性质:
即函数单调且梯度有上下界。
- 噪声条件:
容易证明,均值分析方法得到的:
是一个特殊的 RM 算法。