基于深度学习的人物图像生成模型研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:llljjjxxx7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习与卷积神经网络的发展,计算机视觉领域的研究范围也得到了扩展,其中很重要的一项包括生成式模型的研究。生成式模型体现了计算机对大量样本数据进行建模的能力。尽管目前已经有不少的生成式模型陆续被提出,但这些模型用于图像生成时,生成图像的质量依然没有达到令人满意的效果,尤其是空间结构比较复杂的图像,例如全身人物图像。针对以上提出的一些问题,本篇论文中提出了两种人物图像生成模型,一种是基于姿势的人物图像生成模型,另一种是基于单张图像的人物姿势变换模型。虽然两种模型在名字上有些差异,其本质都是根据不同的输入条件生成一张人物图像。第一种模型接收一张简单的人体姿势图(2维骨架图)作为输入,输出一张对应姿势的人物图像。该模型采用的是一个条件式生成对抗网络的结构;第二种模型则接收两个条件作为输入,一张目标姿势图和一张真实人物图像,输出对应姿势的真实人物图像,且要保留输入人物图像的外貌信息,这样就实现了人物的姿势转换。该模型是在上一个模型的基础上融合一个变分自动编码器的结构,形成了一个混合式的生成模型,因此,该模型同时拥有生成对抗网络和变分自动编码器的优点。此外,为了提高生成图像的质量,两个模型中都使用了已经训练好的卷积神经网络(VGG19)作为损失函数网络。尤其是在第二个模型中,为了保证输出图像与输入参考图像的身份信息(即各种外貌细节)一致,本篇论文还提出了一个新的损失函数,叫做多尺度风格损失函数。实验结果表明在加入多尺度风格损失后,输出图像的细节得到了丰富,且能够保证输出人物图像与输入人物图像的衣服颜色、纹理特征仍然一致。目前,本篇论文中所有的模型都在DeepFashion数据集上进行训练和评估,并与目前现有的人物图像生成模型做了定性和定量的比较,包括PG~2模型以及Variational U-Net模型。对比结果显示,本篇论文中的模型生成的人物图像细节更丰富,更真实,且与指定的姿势、指定的外表差异更小。当然,本篇论文中的模型也存在一些局限性,例如生成的人物图像仅限于任意的站立姿势,模型无法生成坐立姿势或其他类型姿势的人物图像,以及生成的人物图像缺乏背景,这些问题都需要在未来的工作中逐一解决。
其他文献
离心式压缩机是石油化工企业的最常用的一种压缩机,它的运行状态的好坏直接关系着企业的生产稳定性和安全,如果发生设备故障,会造成设备的损伤,还可能引发一套装置的非计划停
分数阶偏微分方程在各个领域的应用中越来越广泛,其中时间分数阶偏微分方程是十分重要的一类数学模型.随着对时间分数阶偏微分方程的研究不断深入,有一类时间混合分数阶扩散
自2004年光大银行发售第一只银行理财产品开始,我银行理财行业迅速发展。截止2017年末,银行理财总规模已达到29.54亿元,是资产管理行业中规模最大的类别。但是,由于监管的不
近年来,共轭高分子由于其自身的优异特性而受到研究者们的青睐,被广泛应用于光电器件、生物医学和传感检测等诸多领域的研究中。共轭高分子的“分子导线”效应能在一定程度上
中间包作为钢液注入结晶器前经过的最后一个反应器,其对钢液的精炼功能渐渐受到了人们的重视。抚顺特殊钢第三炼钢厂在自耗电极真空浇注的过程中利用了漏斗式反应器来分离钢
本文提出了一种基于有限元离散和自适应移动网格的水平集方法,我们用该方法求解非均匀声鼓问题和光子晶体带隙结构优化设计问题。本文提出的方法在迭代过程中会自动调整网格密度,优化水平集方法在界面上的光滑性并减少计算量。数值结果表明了该方法的有效性。
气候变化是我们这个时代所面临的重大挑战之一,对我们所处的社会与环境造成很大的压力。全球致力于应对气候变化所带来的影响,而对受到气候变化影响最大之一的地区——太平洋
太阳能具有绿色无污染、取之不尽、易获取等一系列优点,但其也存在不连续性、受天气变化影响造成利用率低下等问题。本文通过研究改进无机水合盐相变蓄热材料,将太阳能以热能
1994年我国财政体制改革,地方政府财政收入占全国总财政收入比例下降。随着城市化进程的不断加速,地方政府需要大量的基础设施建设,因而面临严峻的财政缺口。为了解决资金缺口问题,地方政府成立了城投公司,城投债是地方政府成立融资平台发行的债券,最初发行规模非常小,只有几亿元。2009年国家投入4万亿刺激经济,城投债出现了爆发式地增长,城投债发行规模由2009年的2000亿,到2018年末发行规模达到24
互联网的普及带来了爆发式增长的线上网络信息,用户淹没在海量数据中,需要耗费大量的时间成本和操作成本才能在电子商务平台找到自己感兴趣的商品。推荐系统技术可以一定程度