论文部分内容阅读
随着互联网的迅猛发展,用户每天在网上产生的图片数据以PB级的速度快速增长。面对这么多的数据,用户对于图片的检索需求也在增大。特别是在某些电商平台,当用户发现某个自己感兴趣的物品,但是用户又不知道商品的名字,这个时候用户只能通过商品图片来搜索物品。然而由于是在海量的图片数据库里面查找,这就要求搜索的算法要非常快和精确。现在广泛应用在图片检索领域的是哈希算法,它的本质是将图片的特征转化为低维的二进制码,仅通过异或运算来实现图片之间的相似度计算,这样就能保证在计算图片之间相似度时候的高效。在视频检索领域,实例搜索是非常重要应用。例如,在某些刑侦领域,如果要在海量的视频数据中找出嫌疑人出现过的帧,对于刑侦工作人员来讲无疑是大海捞针,但是如果有某种算法能够根据嫌疑人的体貌特征就能快速检索出嫌疑人出现过的帧,对于提高相关人员的办案效率无疑会有巨大的帮助。早在20世纪60年代,基于文本的图像检索算法就已经被广泛应用到我们生活。比如早期的搜索引擎,那个时候需要很多用户来对图片数据标注标签,而且大多还要提供一段描述。最后再对这些文本数据进行分词,做成倒排索引进行存储,当时这些算法都取得了很好的效果。但是这些算法存在很多不足:首先,互联网的绝大部分数据是没有标签的,需要人为地去标注很多标签数据,耗时耗力。其次,存储这些文本数据和索引是非常消耗存储空间的,从现在数据的增涨量来看,显然是不可取的。为了解决以上问题,很多学者开始关注于哈希算法。为此,我们在此文中提出了3个哈希算法来解决以上问题:1)深度区域哈希算法,这个算法主要是针对于实例搜索的应用。我们结合最新的目标检测算法和深度哈希,提出了利用物体候选框来解决图片中存在的多物体问题,并且实验结果显示我们的算法在4个数据集上都远远超过最新的实验结果。2)自监督的离散哈希算法。我们提出了一个利用自学习的方法来学习哈希码,并且网络能够同时学习图片特征和哈希码,将两个过程融合到一个端到端的网络。在实验方面,我们利用学习到哈希码测试了图片检索和图片识别两个任务,结果都显示,我们的算法都能超过最新的结果。3)利用对抗网络来学习哈希码。我们结合最新的生成对抗网络,利用图片的生成来辅助哈希码的学习,并且在学习哈希码的过程中我们设计了两种的近似于4)2)9)的函数,避免了在学习过程中的松弛操作。实验结果显示,我们提出的算法远远超过其他哈希算法。总之,哈希算法的研究是非常有前景和科研价值的。