论文部分内容阅读
近年来,随着互联网和多媒体设备的大规模普及,图像已成为信息承载与传播的重要媒介。面对海量的图像数据,如何从中快速、准确地检索出用户想要的图像就成为了一个亟待解决的问题。哈希方法将图像表示成哈希编码,利用哈希编码易于比较的特点,提升了图像检索的速度。然而哈希方法生成哈希编码的质量依赖于提取到图像特征的好坏,传统的基于低级别特征的哈希方法因特征表达能力有限,检索性能并不理想。随着深度学习的快速发展,深度哈希方法凭借深度模型强大的特征学习能力和哈希编码映射能力,可以得到高质量的哈希编码,因而引起了研究者们的关注。目前,有两种常见的深度哈希方法:基于图像标签和基于图像关系。基于图像标签的方法依赖于所构造模型的分类能力,而基于图像关系的方法只考虑了图像语义之间的语义关系,忽略了同语义图像之间的相似关系。因此,本文研究深度哈希方法,对已有基于图像标签和基于图像关系方法做出改进和优化,提出性能更好的深度哈希方法,并基于新提出的深度哈希方法设计并实现了以图搜图的图像检索系统。本文的主要工作内容如下:为改善基于图像标签的深度哈希方法,提出了基于级联模型的深度哈希方法。该方法以级联的方式构建了三个深度哈希映射子模型。根据第一个子模型,我们可以把图像库划分为两个子图像库。另外两个子模型分别在划分后的子图像库上进行检索。在图像检索时,通过三个子模型级联投票来确定具体的检索模型。由于大多数检索图像都在子图像库中检索,因而有很多哈希编码错误的图像会被排除在外,进而检索结果中包含其它类别图像的概率就会明显降低。在真实图像库上的实验验证了基于级联模型的深度哈希方法的有效性。为解决基于图像关系的深度哈希方法对同语义图像无法进一步对比的问题,提出了基于图像相异性的深度哈希方法。在学习深度哈希映射模型时,该方法利用图像深度特征间的相异性来区分具有相同语义的图像,加强了同语义图像的相异性关系学习。因而基于图像相异性的深度哈希方法能够映射生成多样性的哈希编码,以此来区分同语义的图像。实验结果表明所提的方法不仅能对同语义的图像产生多个不同的哈希编码,而且哈希编码相同的图像具有更高的相似性。这充分说明了所提方法的可行性和有效性。为快速地从用户图像库中检索出满足用户需求的图像,设计与实现了基于深度哈希方法的图像检索系统。本系统是基于图像相异性的深度哈希方法在软件系统中的具体应用。本系统是基于浏览器和服务器架构的,用户可以随时随地通过浏览器快速的检索到满足自己需求的图像。同时,本系统在设计与实现过程中,借鉴了模型-视图-控制器设计模式,将系统的交互视图、业务处理、数据访问三个模块分离,降低了它们之间的耦合性,提高了系统的可扩展性和可维护性。