论文部分内容阅读
最近几年,人工智能的研究获得了很大进展,特别是机器学习方面。随着计算机的性能提升,以及数据的大量积累,使得人工智能研究的可行性和迫切性大为提高。在人工智能的浪潮之中,统计机器学习以及深度学习逐渐变成了极为重要的研究方向。在生成式对抗网络GAN(Generative adversarial networks)提出之前,从机器理解数据的角度建立的生成式模型多采用马尔可夫链来对模型训练,效率较低,极大地限制了模型应用于生产中的可能性。随着GAN的提出,其作为深度学习的重要组成部分,正在为计算机视觉领域带来革命性的变革。GAN可以很好提取图像当中的特征,并还原这些特征,因此GAN很适合图像生成。不仅如此,GAN在语言处理、棋类比赛等众多领域都有不错的表现,具有巨大的应用前景。GAN实现了模型从理解到创造的过程,它的诞生意味着人工智能领域的一次进步。如今,生成式对抗网络衍生出了多种不同的分支,如深度卷积生成式对抗网络DCGAN(Deep convolution generative adversarial networks)、Wassertein生成式对抗网络WGAN(Wassertein generative adversarial networks)、边界平衡生成式对抗网络BEGAN(Boundary equilibrium generative adversarial networks)等不同的模型。其中,DCGAN可以看作是卷积神经网络和生成式对抗网络的结合,它具有卷积神经网络的诸多优点,例如局部感受、权值共享,大大减少了参数量。而其他网络模型基本都是从DCGAN演变而来,因此DCGAN具有很高的研究价值。本文以深度卷积生成式对抗网络作为切入点开展研究,首先阐述了 GAN的发展历史和当前国内外的研究进展。接着,详细分析了深度卷积生成式对抗网络的判别器和生成模型结构,其中包括卷积层、转置卷积层和全连接层。同时,详细分析了DCGAN的学习机制和其优缺点。为了研究DCGAN在图像生成领域的应用,本文设计并且基于tensorflow实现了一个5层结构的深度卷积生成式对抗网络,使用CelebA公开人像数据集对其进行训练,最终得出模型,使用该模型进行图像生成。通过对实验结果的分析,发现由DCGAN所生成的图像与真实图像之间有较大差距,效果并不理想。为了增加生成图像与真实图像直接的拟合度,本文提出了尺寸为3和5的卷积核组合使用,将特征图堆叠形成新的特征图,通过不同的感受野来提取原始图像中的特性信息,以增加模型提取或还原的特征的多样性,以及在损失函数中加入结构相似性SSIM(structural similarity index)作为损失函数新的约束项从图像构图、亮度、对比度三个方面来提升生成图像的质量。最后设计了验证实验,对比原始的DCGAN和改进之后的DCGAN所生成的图像质量,通过一个残差网络来作出判断,对这些改进的可行性,有效性进行了验证,并对未来的工作进行了总结与展望。