人工智能大量噪音图像复原基于监督和非监督相结合的条件GAN

人工智能大量噪音图像复原基于监督和非监督相结合的条件GAN(特约点评:利用大量噪音图像转换基于监督和非监督相结合的条件GAN对于图像复原领域是一个巨大创新很好的指导意义。来自网友大鹏的推荐!)

人工智能大量噪音图像复原基于监督和非监督相结合的条件GAN简介:图像到图像的转换和更一般的条件图像生成是计算机视觉的核心。条件生成对抗网络(cGAN)[1]已经成为该领域的主导方法,例如,在密集回归中。他们接受源信号作为输入,例如以图像或文本形式的先前信息,并将其映射到目标信号(图像)。理想情况下,输出应该是来自目标流形的样本,然而cGAN的映射不会限制输出,因此它可以任意离开目标流形[9]。这对学术和商业应用来说都是一个关键问题。如果我们的目标是将cGAN或类似方法用作生产技术,它们需要可靠并且在大量噪音下具有性能保证。

监督回归和分类均受噪声敏感和缺乏输出限制的影响。一个值得注意的研究领域是用无监督学习模块补充监督。无监督模块形成一个新的途径,可以提供相同或不同的数据样本。无监督的途径使网络能够探索标记的训练集中不存在的结构,同时隐含地约束输出。只有在训练阶段才需要添加无监督模块,并且在推理期间不会产生额外的计算成本。在中,原始自底向上网络被修改为在训练期间包含自顶向下的模块。然而,在密集回归中,默认情况下,自下而上和自上而下的模块都存在,因此这些方法不是微不足道的扩展到密集回归任务。

人工智能大量噪音图像复原基于监督和非监督相结合的条件GAN贡献:受监督和非监督途径相结合的启发,我们提出了一种新的条件GAN,其中包括潜在子空间中的隐式约束。我们投入这个新模型'鲁棒的条件GAN'(RoCGAN)。在原始的cGAN中,生成器接受源信号并将其映射到目标域。在我们的工作中,我们(隐含地)限制解码器产生仅跨越目标流形的样本。为此,我们用双路径模块替换原始发生器,即编码器 - 解码器。与cGAN生成器类似,第一个通路执行回归,而第二个通路是目标域(无监督通路)中的自动编码器。这两条路径共享相似的网络结构,即每条路径都包含一个编码器 - 解码器网络。两个解码器的权重是共享的,这促使两个路径的潜在表示在语义上相似。直观地说,这可以被认为是限制了我们的密集回归的输出以跨越目标子空间。即使没有相应的输入样本,无监督通路也可以利用目标域中的所有样本。在推断过程中,不需要监督通路,因此测试复杂性与cGAN保持一致。我们证明RoCGAN与原始GAN(即收敛和最优鉴别器)具有相似的理论性质。设计合成数据的实验是为了使上述子空间可视化并评估我们的直觉。此外,通过对自然场景和人脸两幅图像进行深入实验,可以完成不同的任务以评估模型。我们将RoCGAN与最先进的cGAN和最近的方法[12]进行比较。实验结果表明,RoCGAN在所有情况下均大大超过基线。

人工智能大量噪音图像复原基于监督和非监督相结合的条件GAN实现:表示法:给定一组N个样本,s(n)表示第n个条件标签,例如,先前的图像; y(n)表示相应的目标图像。除非明确提及,否则将声明A1规范。就像cGAN一样,RoCGAN由一个发生器和一个鉴别器组成。 RoCGAN的生成器包括两条路径,而不是原始cGAN的单路径。 第一种途径,即所谓的reg途径从此与cGAN中的对应物进行类似的退化; 它接受来自源域的样本并将其映射到目标域。 我们引入一个额外的无监督通路,命名为AE通路。 AE路径作为目标域中的自动编码器。 两种路径都具有相似的体系结构,即它们都由编码器 - 解码器网络组成。 这两条途径共享解码器的权重,这会鼓励回归的输出跨越目标流形,而不会导致任意大的误差。 发生器的示意图如图1所示。鉴别器可以保持与cGAN相同:它接受reg路径的输出以及相应的目标样本作为输入。

人工智能大量噪音图像复原基于监督和非监督相结合的条件GAN结论:我们引入了鲁棒条件GAN(RoCGAN)方法,这是一种新的条件GAN,即使面对大量的噪声,它也能够利用无监督数据学习更好的潜在表示。 RoCGAN的发电机由两条通路组成。 第一路径(reg路径)执行从源到目标域的回归。 新增路径(AE路径)是目标域中的自动编码器。 通过增加两个解码器之间的权重共享,我们隐含地约束reg路径以输出跨越目标流形的图像。 我们提供了一个线性类比(在附录中),并演示RoCGAN如何创建更强大的结果,同时我们证明它与GAN具有相似的收敛性质[25]。 我们通过实验演示了合成数据以及来自自然场景和人脸的图像,RoCGAN超越了现有的最先进的条件GAN体系结构。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();