随机逼近

Stochastic Approximation

SA 指的是解决寻根（方程求解）或优化问题的一大类随机迭代算法。与许多其他寻根（方程求解）算法（如基于梯度的方法）相比，SA 的强大之处在于它不需要知道目标函数的表达式或其导数或者梯度的表达式。

均值估计（Mean Estimation）

在蒙特卡洛采样中：

E [X] \approx \bar{x} := \frac{1}{N} \sum_{i = 1}^{N} x_{i}

如何计算平均值 $\bar{x}$ ?

收集所有样本，然后计算平均值。但这种方法必须等待样本收集完毕。
迭代计算平均值。

w_{k + 1} = w_{k} - \frac{1}{k} (w_{k} - x_{k})

有：

\begin{array}{l} w_{1} = 0 \\ w_{2} = w_{1} - (w_{1} - x_{1}) = x_{1} \\ w_{3} = \frac{1}{2} (x_{1} + x_{2}) \\ w_{4} = \frac{1}{3} (x_{1} + x_{2} + x_{3}) \\ \dots \\ w_{k + 1} = \frac{1}{k} \sum_{i = 1}^{k} x_{i} = \frac{1}{k} \bar{x} \end{array}

进一步推广：

w_{k + 1} = w_{k} - α_{k} (w_{k} - x_{k})

Robbins-Monro 算法

Robbins-Monro 算法是随机逼近领域的开创性方法，由 Herbert Robbins 和 Sutton Monro 于 1951 年提出，用于解决无法直接观测目标函数的方程求根问题。该算法在统计学、机器学习和控制理论中有广泛应用。

对于方程 $g (w) = 0$ ，假设最优解为 $w^{*}$

在噪声存在的情况下，通过迭代逐步逼近方程 $g (w) = 0$ 的解 $w^{*}$ ：

w_{k + 1} = w_{k} - α_{k} \cdot (g (w_{k}) + ξ_{k})

其中， $w_{k}$ 是对根的第 $k$ 次估计， $α_{k}$ 是个正系数，噪声 $ξ_{k}$ 表示对真实函数 $g (w)$ 观测时的随机误差。

算法收敛性依赖于以下条件：

步长要求：

\sum_{k = 1}^{\infty} α_{k} = \infty (允许充分探索)

\sum_{k = 1}^{\infty} α_{k}^{2} < \infty (抑制噪声累积)

常见选择： $α_{k} = c / k (c > 0)$

函数性质：

$g (w)$ 需满足：

0 < c_{1} \leq \nabla_{w} g (w) \leq c_{2}

即函数单调且梯度有上下界。

噪声条件：

E [ξ_{k} ∣ w_{k}] = 0

E [ξ_{k}^{2} ∣ w_{k}] < \infty

容易证明，均值分析方法得到的：

w_{k + 1} = w_{k} - α_{k} (w_{k} - x_{k})

是一个特殊的 RM 算法。

⚛️ Next.js

📈 Seo

⚛️ React.js

🎨 css

📊 d3.js

🌿 Node.js

🌱 koa.js

🥘 GAMES101

🌌 three.js

🫧 WebGPU

🤖 Rasa

🥝 机器学习

🍿 强化学习

🍳 计算机视觉

🐬 mysql

🧪 jest

随机逼近

Stochastic Approximation

均值估计（Mean Estimation）

Robbins-Monro 算法

随机逼近 ​

Stochastic Approximation ​

均值估计（Mean Estimation） ​

Robbins-Monro 算法 ​

随机逼近

Stochastic Approximation

均值估计（Mean Estimation）

Robbins-Monro 算法