论文部分内容阅读
得益于互联网和数据采集技术的发展,网络上的图像数据也随之迅速增加。如何对大规模的图像数据进行处理并快速获取到所需图像成为了计算机视觉领域一项热门的研究内容。基于文本的图像检索由于需要对图像数据进行大量的人工标记而无法得到广泛的应用,并且标记的强主观性使得检索效果和预期产生了较大的差异。在此背景下,基于内容的图像检索逐渐成为图像检索方法研究的主导方向。传统的基于内容的图像检索算法提取图像的低层特征并生成图像描述符,通过计算描述符之间的欧氏距离来进行相似性度量。然而,图像的低层描述符和人类对图像的理解之间存在较大的差异,直接使用高维特征进行相似性度量,造成了检索速度的下降。卷积神经网络和哈希技术的结合为上述问题提供了新的解决方案。本文通过对深度特征提取和哈希检索技术进行了深入的研究,提出了一种基于聚合特征的深度哈希图像检索模型。本文的主要研究内容如下:
(1)传统的基于卷积神经网络的图像检索算法使用全连接层的特征进行检索,忽略了图像的局部特性,而深度卷积特征经过聚合后能取得更好的检索效果。本文将目标检测算法引入到图像检索中,通过衡量检测到的目标区域和卷积特征粗略定位的区域的差异,构造出一种新的区域权重计算方法。针对传统特征聚合算法仅考虑特征通道稀疏性这一问题,通过加入通道强度对加权算法进行了改进。综合上述两种权重提出了一种基于聚合深度特征的图像检索模型。
(2)现有的深度哈希算法通过在卷积神经网络全连接层后添加哈希层将深度特征映射为哈希码,为避免二值优化问题引入的松弛项增加了模型的训练难度。对此,通过添加正则项对损失函数进行改进减少了量化损失,增加了权值系数一定程度上缓解了训练数据集图像正负样本分布失衡带来的影响,此外在模型中加入分类层,在训练时同时考虑分类误差和量化误差使生成的哈希码具有更高的识别度。最后,结合深度特征聚合算法提出了一种基于聚合特征的深度哈希图像检索模型。
(3)将提出的算法在多个图像数据集上进行了实验,同其它的图像检索算法在常用的评价指标上进行了对比,对算法的有效性进行了验证。
(4)以深度哈希图像检索模型为中心,与餐饮系统平台相结合,设计并实现了一个菜品图像检索系统,丰富了原有系统的检索方式。
(1)传统的基于卷积神经网络的图像检索算法使用全连接层的特征进行检索,忽略了图像的局部特性,而深度卷积特征经过聚合后能取得更好的检索效果。本文将目标检测算法引入到图像检索中,通过衡量检测到的目标区域和卷积特征粗略定位的区域的差异,构造出一种新的区域权重计算方法。针对传统特征聚合算法仅考虑特征通道稀疏性这一问题,通过加入通道强度对加权算法进行了改进。综合上述两种权重提出了一种基于聚合深度特征的图像检索模型。
(2)现有的深度哈希算法通过在卷积神经网络全连接层后添加哈希层将深度特征映射为哈希码,为避免二值优化问题引入的松弛项增加了模型的训练难度。对此,通过添加正则项对损失函数进行改进减少了量化损失,增加了权值系数一定程度上缓解了训练数据集图像正负样本分布失衡带来的影响,此外在模型中加入分类层,在训练时同时考虑分类误差和量化误差使生成的哈希码具有更高的识别度。最后,结合深度特征聚合算法提出了一种基于聚合特征的深度哈希图像检索模型。
(3)将提出的算法在多个图像数据集上进行了实验,同其它的图像检索算法在常用的评价指标上进行了对比,对算法的有效性进行了验证。
(4)以深度哈希图像检索模型为中心,与餐饮系统平台相结合,设计并实现了一个菜品图像检索系统,丰富了原有系统的检索方式。