论文部分内容阅读
图像分类问题作为计算机视觉领域一项基础的研究课题一直备受关注。近几年随着深度学习技术的飞速发展,一般级别的图像分类问题得到了很好的解决。然而随着社会的发展和人类对检索分类需求的增加,细粒度物体分类逐渐代替图像分类成为下一个研究话题。细粒度物体分类如菜品分类、服饰分类、动物子类别分类具有广泛的应用前景。但由于细粒度物体的类内差异大,类间差异小的特点,传统的分类算法不得不依赖于大量的人工标注信息,不仅浪费了人力物力,而且标注存在误差。针对上述问题,本文提出了一种基于部件检测的细粒度分类算法。该算法首先对通用图像分类模型进行改进,在CUB-200-2011数据集上得到了更好的分类准确度。然后,在训练阶段使用原始图像作为输入,人工标注构成的部件或特征点作为真值,结合空间变换网络训练定位网络,实现对部件或特征点位置的检测。其次,通过人工标注构成的部件作为输入,图像标签作为真值,训练分类网络。之后,将定位网络与分类网络连接起来,固定定位网络,单独训练分类网络;同时,在定位网络中引入一个新的损失函数,对预测的部件和真值之间的交叠比进行限制,使得部件的定位可以通过分类结果和构造的损失函数进行自适应的调整,再将调整后的网络固定定位网络,微调分类网络。最后,提取不同部件在分类网络中最后两层卷积层的特征作为特征描述子,将不同部件的特征描述子连接起来作为图像最终的特征表示,进行分类训练,得到了比较高的分类准确度。在原有算法的基础上又增加了部件的数量,对不同部件使用不同的分类网络模型,进一步提高了分类准确度。算法只需要在训练过程中使用标注信息,因此在一定程度上减少了人力消耗。同时,动态调整定位网络、增加部件的数量以及对不同部件使用不同的分类网络模型使得分类结果更加准确。最后,本文将提出的算法模型嵌入到一个细粒度图像分类系统中进行扩展应用。