基于语义一致性和矩阵分解的跨模态哈希检索研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:felixjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多模态是大数据的重要特性,随着大数据时代的到来,像图像检索文本之类的跨模态数据之间的检索已成为潜在的需求。跨模态哈希(Cross-Modal Hashing)方法通过哈希函数将查询数据转变为汉明空间中的二进制编码,即哈希编码,形式上统一了各模态数据,从而将跨模态数据之间的检索转变为哈希编码之间的检索,降低了存储消耗同时加快了检索速度。另外,哈希编码之间通常保持了对应数据之间的相似性,包括模态内相似性和模态间相似性。相似性保持是本文研究的出发点,同时也是跨模态哈希方法的重要组成部分。然而当前大多数跨模态哈希方法仅依据底层特征对数据之间的相似性进行度量,忽略了语义的重要性,不利于缩小语义鸿沟,也不利于提高检索的准确率。人类是从语义层面对事物进行区分和判断的,因此数据之间的真实关系取决于语义。在底层特征具有噪声或者判别性不强时,语义相似性的使用有利于生成具有较好判别性的哈希编码,进而提高检索的准确率。本文从语义层面度量模态内相似性和模态间相似性,提出了两种跨模态哈希方法,分别为:语义一致性跨模态哈希与基于语义一致性和矩阵分解的跨模态哈希。通过在现存的两个主流的数据集上进行实验,验证了方法的有效性。本文的主要研究内容和创新点:(1)语义一致性跨模态哈希仅使用语义度量数据之间的相似性,降低了计算量和哈希编码到高层语义的语义鸿沟,确保哈希编码之间的相似性与原始数据之间的相似性具有语义上的一致性。哈希函数通过线性映射和二值化将数据转变为哈希编码。(2)基于语义一致性和矩阵分解的跨模态哈希同时利用语义和底层特征度量各模态内数据之间的相似性,并用图指示该相似性,缩小了底层特征到高层语义,以及哈希编码到高层语义之间的语义鸿沟。利用矩阵分解构建各模态数据共同的抽象空间,实现数据的抽象表达,并通过量化抽象表达产生相应的哈希编码,最终将哈希函数的学习转换成二元分类中超平面的学习。
其他文献
三重内容可寻址存储器(TCAM)技术是近年来出现的一种硬件查找技术,它可以实现高速路由查找,满足Internet的发展需求。但是TCAM的高功耗一直限制着它的发展。分块TCAM和路由压
中国作为一个农业大国,农作物病虫害发生种类多且影响范围广,给我国粮食生产造成了巨大的损失。区域尺度上准确、及时地监测农作物病虫害的发生情况有利于高效地指导防治工作
目前,海上的交通管理技术,在对目标定位和跟踪的时候,主要采用的还是雷达技术,但是由于雷达子系统对于一些特定的水域环境,特定的时段的监控不便、监控失效,而CCTV系统(Close
本文在微波侦听技术和宽带载波对消理论的基础上,围绕微波侦听技术的理论和实际项目展开,旨在完成三角波调频体制下,提高微波侦听系统抗干扰能力的研究。微波侦听系统通过对
卫星成像装置拍摄的遥感图像常常被云覆盖。利用信息恢复技术获取云覆盖下遥感图像的地物信息,能有效增强遥感图像的清晰度,提高对云覆盖区域地物信息的解译能力。本文针对陆地卫星系列和环境一号卫星获取的薄云覆盖遥感图像,提出了基于图像变换和迁移学习的地物信息恢复算法,主要研究内容与创新如下:1.介绍了陆地系列卫星和环境一号卫星及其图像传感器的基本参数和各波段的主要作用,阐述了遥感图像薄云覆盖区域地物信息恢复
目前,针对Web应用的恶意攻击行为层出不穷并有愈演愈烈的趋势。而针对Web攻击的防御和检测技术还不够完善,主要的问题是缺乏针对新型攻击的检测和防范、检测不够全面、检测准确