【梯度惩罚Wasserstein:GAN:超分】 |
您所在的位置:网站首页 › wasserstein距离微分 › 【梯度惩罚Wasserstein:GAN:超分】 |
Single image super-resolution using Wasserstein generative adversarial network with gradient penalty
(基于梯度惩罚Wasserstein生成对抗网络的单幅图像超分辨率) 生成式对抗网络(GAN)由于其强大的样本生成能力,已被用于解决单幅图像超分辨率(SISR)问题,获得高感知质量的超分辨率(SR)图像。然而,GAN存在训练不稳定,甚至不能收敛的缺点。本文基于Wasserstein GAN提出了一种新的SISR方法,它是一种具有Wasserstein度量的训练更稳定的GAN。为了进一步提高SR性能,使训练过程更加简单和稳定,对原始WGAN进行了两处修改。首先,采用梯度惩罚(GP)代替权值裁剪。其次,在WGAN的生成器中构造一个新的“预激活”权重层的残差块。在4个不同的测试数据集上进行的大量实验表明,该方法在4倍放大倍数下的准确率和感知质量均上级原始的基于GAN的SR方法和许多其他方法。 介绍单幅图像超分辨率(SISR)是计算机视觉领域的一个研究热点,其目的是通过恢复丢失的高频细节,从一幅低分辨率(LR)图像恢复出一幅高分辨率(HR)图像。SISR在监控安防、智能手机、人脸识别、遥感图像、医学诊断成像等主流视觉应用中得到了广泛的应用。尽管如此,图像超分辨率仍然是一个难题,因为从数学的角度来看,它是一个欠定的反问题,而且解通常不是唯一的。因此,为了稳定逆问题并获得合理的SR图像,需要在SR过程中加入一些图像先验或合理的假设。 在过去的几年里,研究者们为解决SISR问题付出了巨大的努力,提出了许多解决方法。这些方法可以大致分为两类,基于插值的方法和基于学习的方法。基于插值的方法,包括最近邻插值、双线性插值、双三次插值和三次样条插值,试图在HR网格中生成未知像素。基于插值的方法具有高效、低计算复杂度的特点。由于其低通滤波特性,基于插值的方法通常产生具有锯齿状伪影和振铃的过平滑HR图像。基于学习的方法学习LR图像到HR图像的映射,然后根据预先建立的映射从测试LR图像推断SR图像。实验证明,该算法能够在一定程度上恢复丢失的图像细节,生成更有吸引力的SR图像。在Freeman等人的开创性工作之后,各种基于学习的方法被提出,例如基于稀疏表示的方法、基于支持向量回归的方法、锚定邻域回归方法、基于层次决策树的方法。为了追求更好的性能,许多研究人员通常在这些方法中采用后处理技巧来进一步减小重建误差,如迭代反投影、双边反投影和约束反投影。近年来,基于卷积神经网络(CNN)的深度学习方法在图像识别、分类、去噪等计算机视觉任务中取得了巨大成功。受SRCNN成功的鼓舞,提出了从FSRCNN、ESPCN、VDSR、DRCN、LapSRN、SRDenseNet到RCAN的变体。这些网络主要在网络深度和结构上有所不同。与传统的基于学习的随机共振方法相比,这些方法无疑取得了更好的性能。这些方法的共同之处在于它们都更加注重提高重建后的HR图像的峰值信噪比(PSNR)。然而,具有高PSNR的重构SR图像不一定产生良好的视觉感知。越来越多的研究者认识到,随机共振方法在提高客观评价指标如峰值信噪比(PSNR)的同时,还应改善重建图像的视觉质量。这一问题也成为感知图像恢复与处理(PIRM)的子挑战。 GAN是另一种高效的深度学习模型,具有很强的样本生成能力。Ledig等人首先提出使用带有感知损失函数的GAN来解决真实感SISR问题,并取得了令人满意的结果。研究人员已经提出了从ESRGAN、ESRGAN+ 、RFBESRGAN、周期中周期GAN(CinCGAN)、SinGAN、RankSRGAN、KernelGAN、RCA-GAN到AMSRGAN的各种基于GAN的变体,这些变体已经取得了更好的结果。尽管遗传算法网络在解决感知图像随机共振方面有着巨大的潜力,但它仍然面临着一个明显的困难,即训练的不稳定性。为了解决这个问题,Arjovsky等人对GAN的训练过程进行了深入的研究,发现如果鉴别器变得更好,则生成器的梯度将消失。这种现象背后的原因是原始GAN所采用的KullbackLeibler(KL)或Jensen-Shannon(JS)散度不能在两个数据分布的支持度没有交集的情况下给予两个数据分布之间的有效度量。为了弥补这一缺陷,采用Wasserstein距离代替散度作为度量,证明了WassersteinGAN的训练比原来的更稳定。然而,它并不是最理想的,它采用了权值裁剪来加强Lipschitz约束,这可能导致产生较差的样本,甚至不能收敛。 受此启发,提出了一种基于WGAN的视觉质量较好的SISR方法。在我们提出的方法中,为了进一步提高SR性能,做了两个改进。一种是用梯度惩罚代替WGAN中的权值裁剪,以提高训练的稳定性。二是在发生器中采用一种新的“预激活”剩余块,以提高其性能。我们叫它SRWGAN-PA-GP。 方法 SRGANGAN为生成具有高感知质量的真实自然图像提供了强大的能力,SRGAN的基本思想如图1所示。 如前所述,原始GAN难以训练,训练不稳定的现象时有发生。为了解决GAN应用于图像SR时的这一问题,对SRGAN进行了两个改进。改进之处一是对生成器网络G和鉴别器网络D设计了新的网络结构,二是采用了新的损耗函数。 Network structure
研究表明,GAN训练困难或不稳定的主要原因是损失函数选择不当。为了缓解这个问题,提出了WGAN。当两个数据分布的支撑不相交时,该方法有效地测量了真实的距离。使用Kantorovich-Rubinstein对偶性获得原始WGAN值函数: |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |