基于哈希学习的跨模态检索技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:free_1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能技术的发展已经越来越成熟,许多基于人工智能技术的高科技公司如雨后春笋般涌现,甚至有不少企业已经生产出了能够改变我们日常生活的人工智能产品。而人工智能技术可以取得如此令人印象深刻的成果,却并非一蹴而就。自1956年人工智能技术诞生至今,已经经历了多次的爆发期与寒冬期,而这次人工智能技术的爆发更加来势汹汹,因为其与之前几次的爆发期相比,具有一个鲜明的特点——以大数据为基础。大数据不仅仅是因其数据量大,更重要的是其数据种类具有多样性,且数据的价值密度较低。我们每天都会产生和接收各种信息,而这些信息都会被记录下来,然后通过各种人工智能技术来分析我们的日常行为、生活习性,以便为我们的生活提供各种便利性的服务。在海量的多媒体数据之中,有些数据并不是相互独立的,它们很可能是对同一事物的不同表现方式,在语义上具有一定的相似性。如何从这些不同类型的数据中检索到需要的数据逐渐已经成为人们的迫切需求,也得到了学术界的广泛关注,这就是跨模态检索。跨模态检索的根本目的是寻找不同模态间具有相似性的样本,是以一种模态的数据作为输入,在数据库中检索出在语义上具有相似性的另一种模态的数据的方法。而哈希方法因为其可以有效的降低数据的存储成本,同时可以加速检索的过程,逐渐成为解决跨模态检索问题的常用方法。然而,现有的基于散列的跨模态检索方法通常对标签数据的利用率不高。同时,由于现有数据存在正负样本不平衡问题,对检索效果有一定影响。针对上述问题,本文提出了一种自监督的跨模态融合散列方法,对类别标签数据进行特征提取。使其能够对数据的语义相关性进行建模,使得在语义特征的监督下,图像与文本数据的特征分布能够趋于一致,帮助不同模态的哈希学习模型更准确地学习相似模态数据之间的语义相似度;同时加入语义保留模块,优化分类损失,使得生成的哈希码可以尽可能地保留语义相似性;设计自适应权重的损失函数,根据每次输入神经网络的训练样本中正负样本的比例,灵活地调整对正负样本分类错误的惩罚的权重;使用二值约束正则项函数,最小化其误差,确保生成的近似哈希码的数值靠近+1或者-1,提升检索的准确率。最后,为了验证本算法的实际效果,将其与一些流行的跨模态检索算法在几个公共数据集上进行比较。结果表明,该算法可以有效提高跨模态检索的准确性。
其他文献
目的探讨阴道超声与腹部超声联合检查在宫外孕诊断中的应用价值。方法 88例经手术确诊为宫外孕的患者,根据检查方式的不同分为对照组(接受阴道超声检查)和观察组(接受阴道超声与
文章阐释了企业技术能力的内涵,对企业技术能力评价方法进行了分析与探讨,综合了企业技术活动领域这个横向维度以及企业技术知识复杂程度这个纵向维度,提出了一个分析与评价企业
目的:对比研究经阴道超声与经腹部超声对宫外孕的早期诊断价值。方法:选取2014年1月-2015年12月期间,我院就诊且经手术病理证实为宫外孕者56例,回顾分析其经阴道以及经腹超声
电厂通过增加吸收式热泵机组对凝汽器乏汽的热量加以回收利用,其经济效益、环保效益、节能减排效益显著。
本文介绍了我院医疗设备信息化管理的模式,以及为了进一步规范和保障医疗仪器设备在科室间的有序流动,开发一套专门针对如何高效地利用医疗设备,优化医疗设备管理流程,提高管理效
采用SiO_2纳米颗粒对变压器油进行改性研究,制备了0.5%、1%、1.5%、2%4种质量浓度的SiO_2纳米改性变压器油。通过比较不同浓度SiO_2纳米改性变压器油的分散稳定性和电气理化
苯丙氨酸脱氨酶(phenylalanine amminoa lyase,PAL,EC4.3.1.5)在pH8-9时催化苯丙氨酸(L-Phe)脱氨生成3-苯基丙烯酸(反式肉桂酸)和氨,pH11时催化逆反应。目前,工业上主要应用红酵母属(Rho
随着国家的重视及教师待遇的提高,教师职业的吸引力越来越强,每年都有大批的高校毕业生及社会人士申请,于是教师录用制度也就得到了重视与改善。最近在我国许多地方都出台了“凡
从微观层面研究企业技术能力的构成要素和联结机制,构建了企业技术能力的"三要素一机制"模型,并对该模型各要素的作用过程进行了分析.以该理论模型为基础,通过对制造型企业的问
针对传统课程教学方法与模式不利于构建应用型人才课程体系的问题,提出采用PBL和项目驱动两种教学模式开展教学改革。文章介绍PBL模式和项目驱动模式的特点与实践现状,分析3类