论文部分内容阅读
近年来,随着神经网络和计算机技术的快速发展,有监督学习作为机器学习的低枝,成果已经被采摘的所剩无几,无监督学习逐渐成为了研究的热点。生成式模型作为尝试解决无监督学习问题的技术之一也有了飞快的发展,生成式模型的主要目的是生成更多的类似于指定数据库中数据的样本,但是同时要求生成的样本具有多样性,不能与指定数据库中的数据重合。利用生成式模型,可以从一个图像数据库中生成一些全新的、从未见过的图像数据,利用有限规模的数据生成大规模的数据库,以此增加样本的数据规模,为机器学习提供更加丰富的训练数据。其中生成对抗网络(GAN)、变分自动编码(VAE)等深度神经网络模型在图像生成方面已经取得了较好的结果。本文主要研究基于注意机制的渐进式的图像生成方法,将人类视觉注意机制与神经网络结合起来,通过对样本数据的渐进式编解码,重构与原始样本相近却不同的新图片。本文主要做了以下工作:1.本文构建了基于生成对抗网络(GAN)的图像生成模型。该模型主要由生成模和判别模型两部分组成,它建立的是一个学习框架,实际上就是生成模型和判别模型之间的一个模仿游戏。生成模型的目的就是要尽量去模仿、建模和学习真实数据的分布规律,而判别模型则是要判别一个输入数据,究竟是来自于真实的数据分布还是来自于一个生成模型。通过这两个内部模型之间不断的竞争,从而提高两个模型的生成能力和判别能力。2.本文构建了一种基于变分自动编码(VAE)的图像生成模型。该模型通过编码器将输入图片编码到一个隐藏空间,然后通过解码器对隐藏空间中的变量进行解码生成图片,它是以传统概率图模型为基础,过一些适当的联合分布的概率逼近,简化整个学习过程,使得所学习到的模型能够很好地解释所观测到的数据。3.本文提出了一种基于注意机制的渐进式图像生成模型。该模型在变分自动编码器的基础上加入了注意机制和循环神经网络(RNN),使得计算机在生成图片时,能够像人类画画一样有重点、有顺序的画,而不是像打印机一样一行一行、一像素一像素的画。本文在MNIST手写数字数据集、CIFIA-10数据集以及CelebA人脸数据集上完成了图像生成实验,通过对比三种模型的生成结果,验证了基于注意机制的渐进式生成模型性能的优越性。