论文部分内容阅读
随着电子商务的持续发展,网络上的服装图像数据量急剧增长。使用人工分类的方式对服装进行分类,存在分类结果不稳定、人力成本高、速度较慢等问题,无法满足目前的实际需求。其中,女装图像不仅数量庞大,同时种类繁多,分类难度较高。因此,女装图像的分类算法是一个有意义的研究方向。近年来,卷积神经网络在计算机视觉方向中多个领域取得了巨大突破。本文基于卷积神经网络对女装图像的分类算法进行研究,主要完成了以下工作:首先介绍了卷积神经网络的理论基础和基本概念。分析了目前女装图像分类这一应用场景下存在的难点问题,针对性的进行算法模型的设计与改进,设计了基于神经网络的图像分类算法结构。女装图像种类繁多,不同种类的图像差异较小,大多只体现在某些关键部位的细节上。除此之外,在进行图片的拍摄中,服装往往会产生一些扭曲和形变、以及部分区域被遮蔽的问题,进一步增加了女装图像的分类难度。本文对传统的基于卷积神经网络的分类算法结构进行改进,针对于关键部位的特征信息进行利用,将关键部位特征与图像全局特征进行融合,更好的将相近类别进行区分。为此,本文设计了针对服装图像的关键点进行定位的方法,并且通过多次实验对关键点定位方法进行优化,便于关键点的特征信息的提取操作。最终的实验结果表明,加入了关键点特征信息的模型在精度上更有优势,模型的鲁棒性得到提升。卷积神经网路在实际应用中,会受到硬件条件以及训练数据数量的限制。针对这一问题,本文提出了“分块卷积”计算方式,来对传统的卷积层进行改进,降低了模型的参数数量和计算量。由于参数数量的减少,模型的复杂程度降低,在不增加训练数据量的情况下抑制过拟合现象。同时,由于计算量的减少,模型的训练过程得到加快,便于超参数的调试。预测速度也得到提升,提升了模型的实用性。实验结果表明,由于抑制了过拟合现象,在训练数据量较小时,模型的测试精度得到一定的提高,同时提升了模型的检测效率。除此之外,为了进一步提升模型的性能,设计了输入图像的预处理方案,对输入图像中的背景信息进行剔除,减少干扰。并且通过实验对比模型的改进效果。最后,本文针对模型的训练过程进行了详细的描述,包括数据集的选取、数据增强以及输出结果进行模型融合等步骤。通过实验数据对比,展示了针对算法的改进所起到的效果。在文章的结尾,针对本文所做相关工作进行了总结,并且指出目前工作存在的一些不足和日后改进方向。