摘要:
随着深度学习的快速发展,生成式模型领域也取得了显著进展.生成对抗网络(Generative adversarial network,GAN)是一种无监督的学习方法,它是根据博弈论中的二人零和博弈理论提出的.GAN具有一个生成器网络和一个判别器网络,并通过对抗学习进行训练.近年来,GAN成为一个炙手可热的研究方向.GAN不仅在图像领域取得了不错的成绩,还在自然语言处理(Natural language processing,NLP)以及其他领域崭露头角.本文对GAN的基本原理、训练过程和传统GAN存在的问题进行了阐述,进一步详细介绍了通过损失函数的修改、网络结构的变化以及两者结合的手段提出的GAN变种模型的原理结构,其中包括:条件生成对抗网络(Conditional GAN,CGAN)、基于Wasserstein距离的生成对抗网络(Wasserstein-GAN,WGAN)及其基于梯度策略的WGAN(WGAN-gradient penalty,WGAN-GP)、基于互信息理论的生成对抗网络(Informational-GAN,InfoGAN)、序列生成对抗网络(Sequence GAN,SeqGAN)、Pix2Pix、循环一致生成对抗网络(Cycle-consistent GAN,Cycle GAN)及其增强Cycle-GAN(Augmented CycleGAN).概述了在计算机视觉、语音与NLP领域中基于GAN和相应GAN变种模型的基本原理结构,其中包括:基于CGAN的脸部老化应用(Face aging CGAN,Age-cGAN)、双路径生成对抗网络(Two-pathway GAN,TP-GAN)、表示解析学习生成对抗网络(Disen-tangled representation learning GAN,DR-GAN)、对偶学习生成对抗网络(DualGAN)、GeneGAN、语音增强生成对抗网络(Speech enhancement GAN,SEGAN)等.介绍了GAN在医学、数据增强等领域的应用情况,其中包括:数据增强生成对抗网络(Data augmentation GAN,DAGAN)、医学生成对抗网络(Medical GAN,MedGAN)、无监督像素级域自适应方法(Unsupervised pixel-level domain adaptation method,PixelDA).最后对GAN未来发展趋势及方向进行了展望.