【摘 要】
:
着装场景下的人体姿态估计能有效提高虚拟试穿的真实性和动感展示,因此,准确估计出着装图像中的人体姿态,对辅助二维虚拟试穿具有重要作用。本文针对时尚着装场景中由于服装款式多样、背景干扰、着装姿态多变等因素,导致着装人体姿态估计精度较低的问题,以时尚街拍图像为例,首先,通过爬取大型时尚街拍图像网站Chictopia,并结合在线图像搜集获得数据集原始图像,使用Label Me对图像进行精细的人体信息标注,
论文部分内容阅读
着装场景下的人体姿态估计能有效提高虚拟试穿的真实性和动感展示,因此,准确估计出着装图像中的人体姿态,对辅助二维虚拟试穿具有重要作用。本文针对时尚着装场景中由于服装款式多样、背景干扰、着装姿态多变等因素,导致着装人体姿态估计精度较低的问题,以时尚街拍图像为例,首先,通过爬取大型时尚街拍图像网站Chictopia,并结合在线图像搜集获得数据集原始图像,使用Label Me对图像进行精细的人体信息标注,以构建时尚着装图像数据集;然后,通过姿态聚类定义时尚着装场景下的姿态类别损失函数,并在堆叠沙漏网络基础上增加多尺度损失与特征融合构建姿态表示模型;最后结合着装部位分割约束人体关节点定位,优化得到更加精确的姿态估计结果。实验结果表明,该方法能够有效地提高着装人体姿态估计精度。首先,针对时尚着装场景下的人体检测精度不高的问题,提出一种基于改进双阶段检测器的着装人体检测模型,该方法首先改进双阶段检测器Faster R-CNN算法的特征提取网络,提高着装人体特征提取效果;然后,重新设置默认锚框尺寸以适用于着装人体检测框比例,并使用区域候选网络生成初步的包含前景的区域候选框;最后,在ROI池化层采用ROIAlign逐像素对齐方式,获得固定尺寸的特征图并输入到全连接层,得到着装场景下精确的人体检测结果。然后,针对着装人体空间背景复杂、服饰穿着纹理颜色多样导致人体关节点特征提取困难以及多变的着装人体视角位置导致人体姿态估计网络学习困难,提出一种时尚着装场景下的人体姿态表示模型。1)基于对时尚着装图像数据集中着装人体姿态聚类得到的姿态模板,定义姿态类别损失函数,并结合欧氏距离损失函数构造姿态表示模型的多尺度损失,提高网络对着装人体姿态变化和不同视角下人体姿态估计鲁棒性;2)通过在堆叠沙漏网络基础上增加多尺度损失与特征融合,构建着装姿态表示网络,以学习关节点的局部和全局特征,解决着装图像多样的背景和人体穿着服饰对关节点特征提取的干扰,增强关节点的定位精度。最后,针对着装人体姿态可见性受到人体穿着服饰的干扰,导致人体姿态估计时存在关节点误定位问题,提出结合着装部位分割的人体姿态估计网络。通过融合残差网络的深层、浅层特征构建着装部位分割网络,使用着装部位分割信息对人体关节点定位进行约束,最后通过姿态优化,提升人体姿态估计时关节点的定位精度。
其他文献
随着电子商务的快速发展,服装市场的潜在价值也在逐步显现,针对服饰检索、服饰识别和服饰推荐等计算机视觉领域的研究出现一系列研究任务。我国有55个少数民族,民族服饰种类繁多,服装结构复杂,语义属性丰富,能够将服饰图像检索技术与民族服饰文化相结合,对民族服饰实现数字化,这对传统民族文化保护具有重要意义。民族服饰图像具有不同民族风格的服装款式、配饰和图案导致的民族服饰图像细粒度检索准确率较低的问题,本文提
近年来,法院工作已经成为互联网媒体和舆论关注的焦点,来势汹涌的网络舆情给法院工作造成了巨大的压力。面向案件微博评论的情绪分析有助于法院等相关部门及时了解和掌握案件微博舆情,然后进行舆情监控和传播引导。面向案件微博评论的情绪分析属于特定领域的任务,存在没有公共数据集、情绪表达具有领域性等研究问题,值得深入研究。本文研究面向案件微博评论的情绪分析方法,主要从以下几个方面开展研究:(1)案件微博评论情绪
金属作为制造业的支柱产品之一,金属的质量优劣影响着终端产品的质量。金属表面缺陷检测是金属质量控制的重要一环。金属的表面缺陷检测中,基于机器视觉的检测技术已经成为主流。机器视觉本质上是模仿人类视觉系统,现在表面缺陷系统中硬件设备已经较为成熟,因而图像处理技术成为研究重点,其性能决定着整个缺陷检测系统的性能。金属表面缺陷图像存在着,缺陷和背景对比度低,缺陷类型和尺寸差别大等问题,同时还存在高光和阴影干
汽车作为一种大众消费品早已进入千家万户,伴随着数量增加,安全驾驶的问题也变得越来越显著,其中危险驾驶行为给驾驶员和乘客都带来了极大的潜在危险和财产损失,由于危险驾驶行为具备隐蔽性和无意识性,需要借助辅助设备进行疲劳驾驶检测,故本文提出了综合多因素的驾驶行为评判标准,在一个网络框架下实现了多任务的融合,实时准确且便于移植,该系统的应用对于驾驶员的安全驾驶,智慧城市的推进都具有重要意义。现阶段的危险驾
肺癌是目前所有疾病中对人类威胁最大,却极难治愈的肿瘤疾病之一。及早发现和尽快治疗是当下仅存的防治肺癌最奏效的措施,肺癌在发病初期主要的表现形式是肺结节,医生可以通过对胸部CT的观察和分析对早期肺癌进行及时诊疗。然而,随着肺部CT图片数量的激增,单纯依靠人工从大量CT图片中进行筛查、判断几乎是不可能的。基于深度学习的计算机辅助系统能够对CT图片进行初步的选取处理,可以大大减轻医生负担,降低医生误诊、
阿尔茨海默病(Alzheimer Disease,AD)以及注意力缺陷障碍症(Attention Deficit Hyperactivity Disorder,ADHD)等神经性疾病深深的影响着每一位患者的健康,该类神经性疾病起病比较迟缓,不容易被诊断出来,如果能够在早期及时的发现,则能够在很大程度上降低该类疾病晚期的发病率。人脑磁共振(Magnetic Resonance,MR)图像中的解剖结构
从时空数据中挖掘模式在人类出行行为、智能交通、城市规划和生态研究等方面有着重要的应用。信息化城市建设的一个重要问题是如何从海量的轨迹数据中挖掘出频繁轨迹序列模式进行定位感知和基于位置的服务(location-based services,LBS)。传统的轨迹序列模式挖掘算法由于挖掘过程中会产生大量中间子序列,严重影响算法收敛速度和挖掘效率。另外,随着定位技术的飞速发展,时空数据的获取越来越广泛,数
老挝作为中国的重要邻国,与中国在经济上有着密切的联系,开展老挝自然语言处理的研究工作存在重要战略意义。其中,机器翻译、信息检索等跨语言信息处理任务需要汉老双语平行语料的支持。双语句子对齐作为构建双语平行语料的关键技术,旨在提取双语文本中语义相同的平行句子对,因此具有重要的研究意义。本文提出一种融合多特征的汉老双语句子对齐方法,从而解决研究中存在的问题,主要工作如下:(1)融合文本特征的汉老双语句子
汉语-老挝语文本相似度计算研究对开展老挝语的自然语言处理研究和中老交流与发展具有重大意义。老挝语属资源稀缺型语言,汉语和老挝语具有相似的句子结构特征,通过在模型中融入语言特征能在有限的训练数据中获取更多的语义信息来提高相似度计算模型的性能。为了获取更准确的双语文本语义表示,按篇章文本的构成将其分为了段落短文本和句子,通过研究不同粒度下的语义表示方法,获取高质量的句子语义表示、段落短文本语义表示,最
引言2021年7月24号,"双减"政策出台。"双减"的任务之一就是要减轻学生不合理的作业负担。而教师作为作业布置的主体,应重视作业的设计。本文就初中英语作业设计中存在的问题,结合课例阐释如何在课程视域下提高作业设计的质量,以便更好地发挥作业的积极作用,落实"双减"政策。