基于infoGAN网络的训练样本生成与实现文献综述

 2022-03-16 22:48:13

研究背景及意义

1.课题背景

自1956年Mc Carthy提出“人工智能”一词以来,人工智能的发展几经波折。而最近几年得益于数据量指数级的增长以及计算机运算力的大幅度提升,人工智能的发展又一次达到了巅峰阶段。虽然人工智能最近几年得到了快速发展,但人们仍然普遍认为,机器离真正的智能还有很大的距离,机器永远不可能替代人类。而自从Ian Goodfellow在2014年10月提出了生成式对抗网络(Generative adversarial networks,GAN)之后,人们的思想就发生了很大的变化。生成式对抗网络GAN主要采用无监督的学习方式,自动从源数据中进行学习在不需要人工对数据集进行标注的情况下就可以产生令人惊叹的效果,从而使机器真正实现了所谓的“智能”。随着人们对生成式对抗网络的研究进入白热化时期,原始GAN的一些问题也越来越受到关注,比如模型崩塌、模型过于自由不可控、模型不收敛等。为了解决这些问题,人们提出了GAN的许多衍生模型。

2.研究目的和意义

GAN,Generative Adversarial Network是目前非常火也是非常有潜力的一个发展方向,原始的GAN模型存在着无约束、不可控、噪声信号z很难解释等问题,近年来,在原始GAN模型的基础上衍生出了很多种模型,如:条件——CGAN、卷积——DCGAN等等, InfoGAN也是GAN的一种改进成果。

2014年,Ian J. Goodfellow提出了生成对抗网络:Generative Adversarial Networks。在生成对抗网络(GAN) 背后的数学理论提到,generator和discriminator的对抗学习,它的目标其实是得到一个与real data分布一致的fake data分布。 但是由于generator的输入是一个连续的噪声信号,并且没有任何约束,导致GAN无法利用这个z,并将z的具体维度与数据的语义特征对应起来,并不是一个Interpretable(可解释) Representation,而这正好是InfoGAN的出发点。 它的原理很简单,在info GAN里面,把输入向量z分成两部分,c和z。c可以理解为可解释的隐变量,而z可以理解为不可压缩的噪声。希望通过约束c与output的关系,使得c的维度对应output的语义特征,以手写数字为例,比如笔画粗细,倾斜度等。 为了引入c,通过互信息的方式来对c进行约束,也可以理解成自编码的过程。具体的操作是,generator的output,经过一个分类器,看是否能够得到c。其实可以看成一个auto-encoder的反过程。其余的discriminator与常规的GAN是一样的。 将给出多张林木样本,然后自动按照该网络进行生成。

  1. 国内外研究概况

生成式对抗网络最根本的应用就是生成和原始数据分布一致的数据。基于这一本质,近年来,生成式对抗网络在很多领域都取得了良好的应用,尤其是在图像、语音和语言等领域,都达到了很高的准确度。

图像:生成式对抗网络应用最广泛的领域就是图像领域。图像领域一经应用,就因其强大的生成能力得到了人们的广泛关注。首先,生成式对抗网络可以由低分辨率图像生成高分辨率图像。SRPGAN模型,对原始的低分辨率图像进行缩放之后,由生成器进行编码和解码,最终生成高分辨率图像。其次,生成式对抗网络还可以用在机器学习中经常见到的图像分类任务中。原始的GAN是无监督模型,对其判别器进行改进,即可用于分类任务,Improved GANs是典型的用GAN来做图像分类的例子。最后,生成式对抗网络可以用于图像风格的转换。利用Cycle GAN不需要其他额外的信息就可以将一张图像从源领域映射到目标领域,可以把马变成斑马等。

语音和语言:原始的GAN模型主要用在处理连续的数据中,而在离散数据上的应用效果并不好。随着研究的深入,人们提出了许多改进的生成式对抗网络模型,使其在处理离散型数据问题时也能得到较好的结果。比较著名的就是Seq GAN模型,Seq GAN模型中的生成器采用递归神经网络RNN的改进模型LSTM,在文本生成中取得了较好的效果,该模型在其他的离散型数据生成中同样表现良好。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。