一种基于深度学习的服装图像实例分割算法研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:chaoshi648
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来电商行业的高速发展和人们消费方式的升级,图像成为了人们获取服装信息的主要载体之一。因此,借助计算机技术对服装图像进行分析处理成为了服装领域数字化发展的一个重要研究内容。其中图像分割技术可以从图像中分离出服装区域,便于后续操作对服装的分析处理,是服装图像处理方向的基础研究内容之一。目前对图像分割的研究主要集中在深度学习算法方向,尤其是Deep Lab、Mask RCNN及其改进网络等图像分割网络模型。尽管这些深度学习算法相比传统算法有了较大提升,然而它们还存在两点不足:(1)在服装区域重合度上仍然不够理想;(2)对于服装边缘的形变适应能力不强。为了提升服装图像实例分割效果,本文针对以上两点进行优化,提出了一种基于深度学习的服装图像实例分割的新算法。算法实现了对图像中每一个像素点的类别预测,从而分离出复杂图像中的服装单体。新算法通过语义分割网络和目标检测网络的协同作用实现了服装图像的实例分割。此外,本文针对前人提出的深度神经网络结构不足分别进行优化改进,设计得到新的深度神经网络结构。在新的研究创新思路下,本文研究首先进行了总体方案设计,并且完成了数据集的建立,为后续的主要研究内容提供了基础。本文研究工作重点分为两个步骤:服装区域的识别和分割和服装单体的定位与分离。其中第一步是将图像中所有服装所在的区域像素从复杂背景中分离出来;第二步则是从第一步的结果中提取不同的服装单体。一、服装区域像素识别与分割本文通过语义分割网络实现对图像中像素点的分类预测,将图像中的服装区域的像素分离出来,从而实现服装的像素级分割。通过在Deep Lab V3+网络结构上进行改进,对其感受野模块和解码器进行重新设计,得到新的语义分割神经网络结构。通过使用新设计的感受野结构替换了原有Deep Lab V3+网络中的带空洞卷积的空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)结构,并且采用转置卷积替换原有解码器中的插值上采样,将上采样步长调整为2,提高了语义分割网络对服装像素分割效果。改进后的网络在服装图像语义分割中获得了97.26%的像素准确率,93.23%的均值交并比和分割阈值在0.75、0.90和0.95时的平均精度分别为90.56%、71.41%和44.80%,相较于Deep Lab V3+在服装图像分割上获得的分割效果得到了大幅提升。二、服装单体的定位与分离在服装单体的定位与分类上,本文主要通过两个部分的工作进行展开:(1)采用目标检测实现服装单体的定位;(2)通过机器学习对服装之间相邻边界的像素进行分离,实现服装相邻边界的像素级精细分割。第(1)部分在YOLOX和Faster RCNN的基础上从神经网络结构上进行改进,将YOLOX中的空间金字塔结构修改为改进的感受野模块,提高了对服装特征的感知能力,对Faster RCNN网络与分割网络进行了结构合并,通过共用特征提取结构减少了计算冗余。对目标检测网络分别训练测试,在服装图像定位与分类中以0.75为交并比阈值时获得了67.4%的均值精度以及77.1%的平均召回率,使得网络在对服装图像的定位和分类准确率获得提高。第(2)部分在服装定位区域的辅助下提取不同服装单体的交界区域,通过机器学习的方法对交界区域中服装像素进行分类预测,从而实现不同服装单体的分离。本文对交界区域中服装像素进行空间和色彩上的特征构建,并分别采用无监督分类(聚类)和有监督分类(支持向量机、逻辑回归)实现不同服装单体像素分类。通过有监督分类和无监督分类分割效果的对比,基于有监督分类训练的逻辑回归模型在较少的时间消耗下获得了较高的服装分离准确率。通过步骤一中新算法(语义分割网络)和步骤二中新算法(目标检测网络)的协同作用,实现了对服装图像的实例分割。在Deep Fashion2数据集上进行网络的训练与测试,新算法获得了76.83%的像素分类均值交并比,在相同的训练和测试条件下,与Mask RCNN的分割结果(69.79%)相比显著提高。即本文算法分割得到的服装区域与实际区域的重合度更高。通过对不同算法获得的服装分割图进行对比,对于非平滑、突变的服装边缘线,前人算法预测的结果以平滑曲线呈现,拟合度不高;而本文算法依然可以实现对服装区域的像素级分类,对边缘线的处理不依赖插值结果,分割结果和真实边缘线拟合度更高,从而对服装边缘形变的适应性大幅提高。因此,本文提出的服装图像实例分割的新算法,可以实现对图像中不同服装单体的像素级分割,与前人研究相比,新算法有效地提高了服装图像识别区域的重合度和边缘形变的适应性。新算法的实现降低了服装图像研究工作中对图像信息复杂度限制,为复杂背景和姿态下的服装图像处理工作奠定了一定的基础。
其他文献
从褐藻中提取的海藻酸钠(SA)是一种聚电解质型无规排列的嵌段聚合物,具有生物相容性好、可降解性好、成本低、无毒等优点,可在生物医学、纺织和组织工程等领域实现广泛应用。目前海藻酸钠常用的纺丝方法有三种,分别为微流体纺丝、湿法纺丝及静电纺丝。研究者们普遍采用的纺丝方法为海藻酸钠湿法纺丝,所用的凝固浴大多为价格低廉的氯化钙溶液,海藻酸大分子中的G结构单元与钙离子形成“egg box”结构,可得到结构稳定
学位
空气相对湿度和空气温度一样,都是影响室内空气品质的关键因素,对人们的舒适度,身体健康以及工业生产具有十分重要的意义。过低的相对湿度会损伤人体的皮肤,降低人们的舒适度,甚至加快疾病传播,危害人体健康,并且容易产生静电积聚损坏电子设备。因此,加湿在低湿度环境中是必要的。为了解决现有非织造布湿膜材料加湿量不足的问题,本课题以黏胶/涤纶(PET)纤维共混水刺非织造布(NW)为基材,通过湿度辅助静电纺丝方法
学位
乡村旅游社区农户的适应性选择对推动旅游产业可持续发展、生态宜居的乡村建设及农户生活有着重要意义。选择伏牛山河南片区10个特色旅游乡村社区为调研地,从微观视角连接乡村旅游社区生态系统及农户生计福祉间关系,构建农户“生态依赖—生计福祉”的生计适应性响应模式,并进一步分析乡村旅游社区农户生计适应性响应结果选择的影响机制。结果发现:(1)发展乡村旅游可以打破传统固化的生计模式,农户选择高生态依赖增强自身获
期刊
织物疵点检测是纺织生产质量监测过程中重要的环节。传统的疵点检测方法是人眼目力检测,有着准确率低、劳动强度大等缺点。随着计算机视觉技术的发展,出现了采用图像处理技术进行疵点检测的研究,但传统的图像处理技术依赖人工设计的特征提取器,难以适应复杂多变的织物组织和疵点类型。近年来深度学习技术的飞速发展,为织物疵点检测带来了新道路,然而深度学习普遍依赖大量的数据进行训练,尤其是经过标注的数据,这是织物疵点检
学位
选区激光熔化(SLM)技术是目前最为成熟的金属增材制造技术,用于复杂结构件成形,具有周期短、精度高、可用材料多样等优点。但该技术冷却速率极快,且逐点、逐层堆积成形容易导致冶金缺陷、组织不均匀、各向异性明显等问题。工艺参数是影响选区激光熔化技术成形组织和力学性能的重要原因。本文在135-335 W激光功率、400-900 mm/s扫描速度以及25-140 J/mm~3激光能量密度范围内,以316L不
学位
新时代高等职业院校加强劳动教育是推动经济转型升级的现实需要,是高等职业教育提质升级的关键环节,也是落实立德树人根本任务的重要途径。近年来,在国家政策红利刺激之下,劳动教育迅速“破题”,各高等职业院校将劳动教育摆在突出位置,有组织、有计划地开展劳动教育。然而,表面上的轰轰烈烈并不能掩盖背后隐忧。为全面把握当前高等职业院校劳动教育的开展现状和学生的劳动素养,通过对全国14所高等职业院校2347名师生的
期刊
镍基高温合金因为拥有优秀的耐高温性能,满足服役在恶劣环境下的要求,因此应用于大量领域。W、Mo作为合金的主要强化元素,在γ、γ’相中的分配行为对镍基合金持久性能有极大的影响。本文基于密度泛函理论,系统的研究了掺杂原子W、Mo对γ’相的几何结构、电子结构的影响,以及处于γ/γ’相界面的W、Mo原子对界面空位和扩散的影响。通过前期实验数据,显示γ’相中Al/Ti 比值约为0.66。本文采用Al/Ti
学位
极限电流型氧传感器通常用于冶金、电力、汽车等领域,因其测氧范围广、响应时间短、氧灵敏度高、稳定性高、制备工艺简单且成本较低等特点备受关注。以Y稳定的氧化锆(YSZ)为电解质的氧传感器需要在高温下工作,由此限制了传感器性能的提升。开发在中低温条件下具有较高氧离子电导率的电解质材料可改善氧传感器的性能。掺杂的氧化铈基材料因其在中温下具有比其它材料都要高的电导率,而被认为是最合适替代的电解质。为抑制该材
学位
<正> 人们对艺术瓷旅游纪念品的需要越来越多,如陶瓷佛像、小动物等等,相当一部分是用贵重金属装饰的。为降低成本,制做仿金产品,对陶瓷镀膜装饰工艺进行了初步摸索,简介如下:
期刊
因具备高温稳定性、优异的机械性能、电绝缘性、耐物理化学腐蚀和良好的生物相容性等综合性能,聚芳醚酮(PAEK)树脂在航空、汽车、生物、医疗器械等领域用作碳纤维(CF)复合材料的基体而被广泛应用。由于PAEK树脂本身分子链的难溶解性和熔体粘度的限制,在制备CF/PAEK复合材料中通常会选择固体基的浸渍方法,例如薄膜叠层法、混杂纤维法、水悬浮浸渍法、粉末浸渍法和混编模压法等。但这些浸渍方法往往会导致PA
学位