基于生成对抗网络的服装图像合成研究

来源 :武汉纺织大学 | 被引量 : 0次 | 上传用户:baimeng1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能在服装业的快速发展,虚拟试衣、时装展示和虚拟现实等技术得到了广泛应用,线上购买服装逐渐成为一种趋势,在网购时,在线用户一般希望可以查看时装模特不同姿态的多张照片。为了满足用户的需求,可以利用服装图像合成技术来增强用户的购物体验,同时也能降低商家成本。传统基于特征表达的图像合成只能处理简单规则的图片,特征表达能力受到限制,难以处理复杂分布的图像合成,随着深度学习的快速发展,生成对抗网络被广泛应用在图像合成的领域,但是传统的生成对抗网络存在着生成图像模糊,训练不稳定等弊端。基于以上问题,本文引入注意力机制,结合生成对抗网络搭建服装图像合成系统,主要工作如下:(1)为了解决基于传统卷积神经网络的人体姿态估计所带来的细节信息丢失问题,本文提出了用于人体姿态估计的注意力沙漏网络。传统的方法采用坐标回归的方式提取二维人体关节点,但是随着网络的加深,人体关节点的信息会慢慢丢失,为了克服信息丢失导致预测关节点精度降低的问题,本文在传统的卷积神经网络中引入了一种基于注意力机制的特征提取模块,该模块由深度可分离卷积单元和通道注意力机制单元组成,替换了传统沙漏网络中的残差模块,使用深度可分离卷积代替常规卷积,极大减少了模型训练参数和计算复杂度,在训练注意力沙漏网络时,添加特征匹配损失函数,解决了梯度消失的问题。(2)为了解决在服装图像中的人体和服装边缘信息提取丢失问题,本文提出了一种基于注意力机制的语义生成网络。虽然传统的Bicycle GAN网络通过多尺度的方式进行特征融合,但边缘信息仍不能有效提取出来,为了更好地捕获像素级语义信息,本文在语义生成网络的最后一层添加注意力机制,对网络最后一层特征图的通道上添加Softmax回归,将更多的注意力放到人体和服装的边缘,充分提取语义信息。(3)提出了一种新型的服装图像合成框架。传统生成对抗网络不仅很难生成高分辨率图像,而且生成的服装图像中缺乏真实纹理信息,基于此本文提出了一种使用Pix2pix HD网络模型的纹理生成器,通过多尺度生成器和鉴别器训练网络,获取全局的视野,能够使纹理生成器生成全局一致的图像,同时多尺度判别器能使得纹理生成器产生更精细的纹理细节,进而生成高分辨率、较为逼真的服装图像。本文研究在MPII数据集、Deep Fashion数据集、Market-1501数据集上进行了对比实验和结果分析,与其它主流方法相比,本文所提出的方法预测关节点准确度更高,在图像合成质量以及定量评估指标上有了明显提升。
其他文献
学位
学位
学位
学位
学位
学位
重大突发公共卫生事件是指突然发生,形成严重社会影响,需要采取应急处理措施的公共卫生事件。如传染病疫情、重大食物中毒等,特点是社会影响大、危险系数高、不确定因素多。在不同的时代背景下,重大突发公共卫生事件具有不同的舆论特点,本文先从概念入手,从法学、公共管理学、社会学厘清重大突发公共卫生事件与重大突发事件,城市重大突发事件,突发公共事件的概念差异,明晰重大突发公共卫生事件的概念内涵。再以改革开放后1
学位
本课题来源于校企合作项目:“磁导引自动落布无人运输车”。针对织造车间人工落布方式落布运输效率低、劳动强度大、危险系数高等问题,设计开发一种自动落布小车,由自动落布机构和用于移动的AGV小车组成。主要从以下几个方面进行研究:(1)介绍了国内外纺织行业落布与运输方式的现状,接着分析了各种落布运输方式的优缺点,最后对本课题的主要研究内容进行了大致的规划。(2)通过分析织造车间的相关参数如织机间距、布辊长
钢材表面是否存在缺陷,将会直接决定钢材质量与产品等级。在钢材表面缺陷检测中,由于光电检测与图像处理检测所存在速度慢、准确率低等问题,本文运用深度学习理论与技术,可以实现对钢材表面缺陷高效和准确检测,其主要研究内容有以下几个方面:首先,准备钢材表面缺陷图像数据集。针对无数据集情况,采用网络收集并借助label Img工具标记数据集;针对数据集中缺陷种类多、数据杂,采用可视化方式统计数据,分析各种缺陷