主题
Isola P , Zhu J Y , Zhou T ,et al.Image-to-Image Translation with Conditional Adversarial Networks[C]//IEEE Conference on Computer Vision & Pattern Recognition.IEEE, 2016.DOI:10.1109/CVPR.2017.632.
Pix2Pix 是一种基于条件生成对抗网络(Conditional GAN, CGAN)的图像到图像转换模型。
条件生成对抗网络
生成器 G 用到的是 Unet 结构,判别器 D 用到的是条件判别器 PatchGAN
Unet
PatchGAN
对图像的局部区域(如 70x70 像素的“Patch”)进行真伪判断,而非整个图像。
G 的作用是为了迷惑 D,同时产生与真值(Ground Truth)很像的图像。因此,再加一个与真值的L1 loss:
L1 loss
最终目标为:
作者认为L1 loss可以恢复图像的低频部分,而GAN loss可以恢复图像的高频部分。
GAN loss