论文部分内容阅读
随着网络技术的发展,如何快速地从海量的互联网图像中准确地找到需要的图像信息,已成为当下重要的研究课题。传统的基于内容的图像检索主要根据底层视觉特征进行检索。由于低阶层的可视化特征与高层的人类语义感知之间存在“语义鸿沟”问题,传统方法的效果不尽人意。研究发现,深度神经网络具有从数据中抽象出高层语义特征的能力,因此越来越多研究人员将深度神经网络应用到图像检索领域。然而,现阶段在图像检索中所运用的深度神经网络的网络结构、网络训练准则和特征提取方式等是基于图像分类的应用场景设计的,并不完全适用于图像检索领域。针对图像检索中的“语义鸿沟”难题和特征匹配标准,本文以深度神经网络为基础,更改网络的训练准则,提出了以相似性度量为代价函数的三元组卷积神经网络,并提出从中提取未激活的多尺度集合特征,使学习所得的语义特征适用于图像检索。此外,创新式将多级网络结构应用于图像检索,提出基于三元组多级卷积神经网络的图像检索算法,以学习既具有全局化信息又具有局部化信息的语义特征。本文的主要工作如下:(1)更改网络训练准则。优化网络的代价函数,将相似性度量作为训练准则,设计基于三元组卷积神经网络的图像检索算法,以学习更有利于检索的高层语义特征,应用到常见的物品和纹理图像检索任务,并创新式应用于布料图像检索任务中。(2)优化特征提取方式。提出将从深度神经网络中提取的未激活特征应用到图像检索中,以避免有用的特征信息在激活后丢失。提出融合深度神经网络不同层级的特征,形成多尺度集合特征,让用于检索的特征涵盖不同层次的语义信息,减小“语义鸿沟”。(3)解决同领域训练数据集缺失难题。针对图像检索应用中,被检索数据集的训练样本不足以训练庞大网络的情况,创新式将迁移学习应用于图像检索,提出采用与被检索数据集互属相似领域的数据集来训练网络,应用于布料图像检索任务。(4)优化网络结构。创新式将多级网络结构应用在图像检索中,提出并设计基于三元组多级卷积神经网络的图像检索算法,在网络顶层、中层和底层加入监督信息,以学习既具有全局化信息又具有局部化信息的高质量语义特征,提升图像检索的准确率。