基于深度多监督哈希的快速图像检索

来源 :大众科学(周刊) | 被引量 : 0次 | 上传用户:qq243396832
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着互联网平台上各类APP在人们之中的盛行,快速图像检索技术更新的需求日益迫切,因此近十年来在快速图像检索领域应用广泛的哈希算法越来越无法满足人们的需求。本文通过在哈希算法中引入深度学习的概念,同时运用分类和验证信息等多监督方式,最终形成可以应用于快速图像检索的深度多监督哈希(Deep Multi-supervised Hashing,DMSH)。深度多监督哈希DMSH可以极大地提升快速图像检索在时间和空间上的效率,提高为用户检索所需信息的准确度。
  关键词:深度哈希;多监督;图像检索
  引言
  随着各类社交平台在人们生活中盛行,图片、影像等数据呈现飞跃式增,人们迫切需求更高效的数据处理方式。哈希方法便是一种高效的数据查找方式,它通过将图像数据转换为低维表示或者一组有序的二进制编码,大为减少了图像所需的存储空间。同时直接读取图像哈希码的检索时间,比读取高维图像文本特征的检索时间更短。之后,深度学习概念的引入进一步提高了哈希算法的实用性,通过在输入图像后构建卷积层,引入分类信息和验证信息等多监督方式,DMSH能够同时进行图像特征的提取和哈希函数的学习,极大程度地加强其在图像特征上的表达能力,从而在时间和空间上更有效率的检索图像。
  一、快速图像检索的现存技术不足
  (一)传统哈希方法无法满足快速图像检索的效率需求
  传统哈希方法包括局部敏感哈希(Locality Sensitive Hashing,LSH)和谱哈希(Spectral Hashing,SH)等,在图像数据特征的标记过程中需要手工进行,同时分步骤进行图像特征提取和将特征转换为哈希码。但手工进行特征标记意味着只能进行线性特征的编码,难以捕捉转换图片中隐含的语义信息。如LSH便是将通过哈希变换后相似图像对的数据,采用随机映射算法放入相同的原始数据分区内,让具有相似特征的图像划分在相同的空间中。因此,随着图像数据的增多,为了准确表达图像数据的特征并将其放入相应的原始数据分区内,往往需要输出很长的哈希编码来将特征全部包含在内,从而保证其有效性,但图像检索的响应时间也会随哈希码的增长变长。
  (二)哈希码提取不完善使图像检索不准确
  图像数据随互联网发展不断增多,在进行图像的成对对输入时,非相似图像的组合要远多于相似图像组合,正负样本之间存在失衡的问题。由于这些非平衡数据的存在,在正样本中的图像分类任务中准确率可以近乎 100% ,但与此同时在负样本中进行的分类任务准确率却不到10%。因此,一般哈希算法中快速图像检索的准确性会随着图像数据的增多而下降。同时,为了保持欧式空间和汉明空间的一致性,传统哈希方法一般通过激活函数的方式来逼近离散二值,但这会使得反向传播变得困难,当图像的训练数据增多时还会相应的产生训练时间加长的问题,不利于进行图像的快速检索。而如果采用sigmoid等非线性函数则会减缓网络收敛的速度,导致图像检索时无法准确查找相似图片。
  二、深度多监督哈希在快速图像检索上的应用
  (一)深度多监督哈希的结构
  DMSH是一种在深度学习基础上构建的多监督哈希网络,具体的网络结构如下图所示。
  在进行成组图像的输入时,先经过一个卷积层,在经过由38个两两相连的Block结构和卷积采样层形成的基础模块,最后再经过两个全连接层和单独的特征层后,分别进入用于约束的分类、验证和哈希分支。在最后的约束环节中通过将每副图像分类到不同的子类中,让深度哈希学习到的特征能够很好地预测图像的标签信息,保证哈希编码的在类别上的可区分性,从而增加图像的类间距离。然后是利用验证任务,让信息相近的图像映射得到相似的特征,信息差异大的图像在映射后得到非相似的特征,从而将相似图像的类内距离不断减小。在该网络模型中,能够同时进行特征学习和哈希函数的训练,极大地缩短了网络查询的时间,提高了网络查询的效率。
  (二)更新损失函数获得更优秀的哈希编码
  首先我们可以引入加权的方法,通过增加相似图像对的权重、添加惩罚项降低非相似图像对的权重等方式,构建更合理的的损失函数:
  式中:将用来衡量从不同图像中获得的特征值之间的距离。α、β则作为调节正负样本不平衡的超参。
  其次,在分类任务中引入softmax函数,将输入的特征分到不同的类中:
  式中:当i≠t时,目标概率分布Pi=0,则预测概率分布P1=1
  最后则是用欧式距离替代汉明距离,通过将输出的哈希编码每一维数据的绝对值与1求方差,使输出数据最大化或最小化从而接近-1或+1,输出近似二值的特征:
  式中:a是向量,在k维上,k=12,12,36,48bit。
  综上所述,总体的损失函数可以设为:
  式中:是上述函数所求值在总函数中的权重。
  在整个DMSH网络结构中,当将任意图像输入检索相似图片时时,都能从图像中提取出能准确、完整地描述图像包含信息的哈希编码,然后根据哈希码寻找相似图片并按共有特征的重合程度进行排列,从而将快速图像搜索准确性提升到更高。
  结语
  基于深度多监督哈希构建的快速图像检索技术,能够获得差异更小的图像真值特征和哈希特征,同时将分类信息和驗证信息等作为监督方式,降低图像数据类内距离并扩大其类间距离,从而提升快速图像检索在时空上的效率。通过在损失函数中加入了量化误差、权重惩罚等方法,降低正样本与负样本之间数据不平衡对结果的影响。同时在网络输出上进行正则化从而减少图像真值特征和哈希特征的不同,最终得到紧凑而表达准确的哈希编码。深度多监督哈希不仅在快速图像搜索领域能够发挥出更高效的应用,还可以广泛应用于人像搜索、社科以及地理环境等其他科学。
  参考文献
  [1]李泗兰,郭雅.基于深度学习哈希算法的快速图像检索研究[J].计算机与数字工程,2019,47(12):3187-3192.
  [2]王华秋,郎帅.深度哈希卷积网络在图像检索中的应用[J].重庆理工大学学报(自然科学),2019,33(03):98-106.
其他文献
摘要:对于新的经济形势而言,中国经济深化改革,加大开放力度,经济发展呈递增趋势。但是,在经济发展的当下,环境问题和污染问题愈发严峻,自然环境和生态环境受到了极大的破坏。基于此种情况,污染源的在线监控被提上日程。一方面,随着科学技术的发展,污染源的在线监控工作,可以在先进技术的支撑下对环境状况进行实时掌控,具备高效性和科学性的特点。另一方面,在线监控能够保障环境的质量,在减少污染的基础上,缓解了人和
期刊
摘要:随着我国航空技术的迅猛发展,相关企业逐渐加大了对航空安全的重视度,特别是雷雨天气下,塔台指挥工作的安全开展更是给予了充分关注。基于以上情况,本文在雷暴天气对塔台管制影响的基础上,从加强学习理论知识,提高管制处置能力;积极与机组沟通,主动协助机组绕飞;提前形成塔台管制指挥预案,与相关部门协调;充分利用设备,掌握最新动态四个方面入手,研究了雷雨条件下塔台指挥措施。希望通过这次研究,为塔台管制人员
期刊
摘要:2020年3月20日上午8时,经江苏省交通运输厅批准,根据苏北航务管理处年度航闸养护计划安排,苏北运河邵伯三号船闸按计划正式开始实施停航大修,预计工期40天。邵伯三号船闸建成于2011年,闸长260米,宽23米,闸门槛水深5米,设计单向年通过量3100万吨,建成至今共安全运行301048个闸次,而长年累月24小时不间断运行导致三号船闸下游闸门漏水较为严重,还伴有闸门门头跳动问题,跳动量偏高导
期刊
摘要:如果将电力现货市场形容成棋盘,那么增量配电网凭借着自身的独特性便在这一棋局中占据着至关重要的地位。因此,本文通过对增量配电网市场机制的叙述,探讨我国电力现货市场下的增量配电网运营模式,并提出以提高电力现货市场下增量配电网运营效率为目的的措施。  关键词:电力现货市场;增量配电网运营;分析  中图分类号:F426.61 文献标识码:  通常情况下,人们将新添加的配电网称之为增量配电网,而官方给
期刊
摘要:IP网络作为信息化时代的发展产物,是信息网络快速发展的代表,在新一代IP网络中路由器技术作为一种关键性的技术,在实际的应用过程中展现出了较高的研究价值。近年来,网络化不断普及,推动了网络宽带业务的快速发展,互联网用户数量不断增多,数据业务呈爆炸性发展趋势,用户对网络质量提出了更高的要求,应适应性的改变网络的种类、规模及速度,由于网络本身发生了改变,促使路由体系结构发生变化。  关键词:计算机
期刊
摘要:航空管制主要工作就是将空间合理规划,避免飞机在飞行中发生冲突,从而对国家的领空与飞行安全进行保证,因此,航空管制人员不但需要具有丰富的知识,专业的操作技术,还需要有良好的心理品质,可以对突发问题及时处理的能力。因此加强对航空管制人员心理研究,使航空管制人员的心理素质提升,使整体心理健康水平得到提升有着十分重要的意义。本文就航空管制人员的人格特征进行了分析,也分析了应付方式与心理健康之间的关系
期刊
摘要:随着经济的不断发展,国有企业在国家经济体系中,占据着重要地位。国有企业对我国的经济建设有着至关重要的影响,随着企业的不断发展壮大,企业也要进行相应的改革,以便适应时代发展的需要,企业改革主要针对:企业的所有制、产权结构等各方面进行变革活动。改革途径以整体上市和分拆上市为主要方式。国有企业在上市方面,也会出现一系列的问题,企业要统筹上市出现的问题,结合自身发展情况,为企业成功上市提供保障。国有
期刊
摘要:当前计算机网络安全存储的质量控制,需要有新的技术作为支撑才能发挥积极作用,云计算技术的应用就显得比较重要。云计算技术作为新型的应用技术,是保障计算机网络安全存储的有效技术手段,基于此,本文先就云计算技术应用的特点以及计算机网络安全存储技术加以阐述,然后就计算机网络安全存储的问题和云计算技术应用措施详细探究,希望能从理论上就云计算技术的科学化运用,为实际网络安全存储工作的良好开展起到积极促进作
期刊
摘要:随着互联网与信息技术的快速发展,如今利用互联网搜索自己需要的信息已经是人人具备的生活技能,同样,互联网信息的有效利用也进入各行各业,为如今社会的生产生活发挥了巨大功效。如何能进一步发挥信息资源的作用,提升工作效率,让生活更美好,是如今面临的重大挑战。本文旨在探讨充分运用互联网优势,如何能更好地将信息资源获取并收集整合,让信息资源的应用进一步发展,迈入新的时代。  关键词:互联网经济时代;信息
期刊
摘要:拳击教练员在组织青少年进行训练过程中,增设心理训练项目将会体现出非常重要的现实意义,这还必须要得到拳击教练员的高度重视。所以,在本文就先对心理训练的现实效用做出详细阐述,然后再从差异化训练、引领和认知、完善心理活动监测体系三个方面,来对拳击运动员的心理训练方法做出研讨。这样会促进青少年理想竞争目标的实现,也会促进青少年专业训练质量、成效和能力的的提升,还有利于青少年心理素质的明显增强,从而使
期刊