主题
✅ 输出范围 (0,1) 适合概率预测 ❌ 梯度消失问题 ❌ 计算成本较高
✅ 计算高效 ✅ 缓解梯度消失 ❌ 可能出现神经元死亡
✅ 输出中心对称 ✅ 比 Sigmoid 梯度更强 ❌ 仍存在梯度消失
✅ 输出概率分布 ✅ 适合多分类问题 ❌ 对极端值敏感