Skip to content

SPADE / GauGAN

Spatially-Adaptive Normalization [2019]

Park T , Liu M Y , Wang T C ,et al.Semantic Image Synthesis With Spatially-Adaptive Normalization[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).IEEE, 2019.DOI:10.1109/CVPR.2019.00244.

https://github.com/NVlabs/SPADE

SPADE 是一种用于语义图像合成的深度学习技术,由 NVIDIA 团队在 2019 年的论文《Semantic Image Synthesis with Spatially-Adaptive Normalization》中提出。它通过改进归一化层机制,显著提升了生成图像的质量和语义一致性。

Spatially-Adaptive normalization

hi 表示深度卷积网络中第 i 层对一批 N 个样本的激活值,Ci 为该层的通道数量,HiWi 分别表示该层激活图的高度和宽度。

类似于 BN,激活值(nN,cCi,yHi,xWi)为:

γc,y,xi(m)hn,c,y,xiμciσci+βc,y,xi(m)

其中 hn,c,y,xi 是归一化前该位置的激活值,μciσci 分别是通道 c 中激活值的均值和标准差。

μci=1NHiWin,y,xhn,c,y,xiσci=1NHiWin,y,x((hn,c,y,xi)2(μci)2)