基于协同训练的跨模态哈希检索方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:free_1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体设备、互联网以及云计算等技术的迅速发展与普及,信息社会进入了大数据时代。文本、图像、视频、音频等来源广泛、形式多样的多媒体数据作为信息传播的载体,蕴含着丰富的社会价值与经济价值。如何对这些数据进行高效的分析与管理,从中挖掘出有价值的信息并加以利用,成为社会各界广泛关注并亟待解决的问题。作为数据检索的一种传统方法,哈希算法由于搜索速度快、占用存储空间小等特点,得到了广泛的应用。因此,基于哈希算法的跨模态检索技术具有重要的研究意义。现有的无监督跨模态哈希检索方法更多地关注如何将不同模态的原始数据嵌入到公共低维子空间中,以实现跨模态数据的特征匹配,从而方便进行相似性度量,而对于跨模态数据本身固有的判别性结构信息,并没有充分挖掘利用。本文在深入学习矩阵分解、稀疏子空间学习、协同训练以及图嵌入等相关知识的基础上,针对现有跨模态哈希方法存在的不足,对其进行改进与提升,提取并合理利用跨模态数据固有的结构信息,完善基于协同矩阵分解的跨模态哈希检索框架,主要的研究内容与成果总结如下:1.针对现有协同矩阵分解哈希忽略了数据的模态内相似性保持这一不足,提出一种基于稀疏子空间学习的局部线性跨模态哈希方法。在协同矩阵分解哈希框架的基础上,利用稀疏子空间学习,得到数据局部线性结构的稀疏低维表示,将其作为数据的模态内相似性约束,量化矩阵分解的低维表示系数得到统一的哈希编码。2.为了有效地挖掘跨模态数据本身固有的判别性结构信息,并使不同模态的数据结构信息相互约束,提出一种基于协同训练的矩阵分解跨模态哈希方法。利用协同矩阵分解将不同模态数据映射到公共子空间,得到数据的低维潜在语义表示,同时,通过协同训练方法提取各模态的结构判别信息进一步约束数据的模态间相似性,并利用近邻约束保持数据的模态内相似性,使生成的哈希编码更具判别性。实验结果表明,相比于现有的无监督跨模态哈希方法,本文提出的基于稀疏子空间学习和协同训练的跨模态哈希检索方法提高了检索精度,表现出了良好的检索性能。
其他文献
正交频分复用(OFDM)指数调制(IM)是一种典型的多载波调制技术。相比于传统的OFDM,在快时变信道下,OFDM-IM对子载波间干扰(ICI)具有更强的鲁棒性。另外,OFDM-IM能够在不增加调
对话管理(DM:Dialogue Management)在人机对话系统(DS:Dialogue System)中扮演着重要角色。基于马氏决策过程(MDP:Markov Decision Process)的对话管理建模取得了不少进展,但
大庆油田总医院信息系统是应用计算机和计算机网络为医院所属各部门提供病人医疗信息、财务核算信息、行政管理信息和决策统计信息,对这些信息进行收集、存储、处理加工以满
语音不仅是人与人之间信息的沟通的媒介,也携人自身与众不同的特征,同时也具有共性及各自独立的变性等特征。声纹特征是一种生物特征,它包含着说话人生理、物理构造不同的特
在海量数据时代,如何有效处理视频等大规模数据,挖掘有效信息,是目前科学和工程领域亟待解决的问题。非负矩阵分解(Non-negative Matrix Factorization,NMF)作为一种有效的矩阵
云数据中心作为云计算的重要组成部分,已经取代了传统的数据中心,而大规模云数据中心的建设和运转,不仅带来大量的电能消耗和二氧化碳的排放,且资源利用率普遍过低,造成了环
虚拟机不仅提供高效和安全的计算资源容器,而且可以在多个物理主机之间平滑迁移。虚拟机的动态迁移是基于多个虚拟机的环境中的一个强大的管理工具,它已成为促进系统维护、负
在三网融合需求的促进作用下,中国国家新闻出版广电总局提出了下一代广播电视网(Next Generation Broadcasting Network,NGB)的概念,使用有线电视网络实现广播电视网、电信网
随着计算机和数字图像处理技术的迅速发展,基于计算机视觉的智能监控已逐渐应用到公共安全、智能交通、军事、工业检测等领域,而视频中的运动目标检测与跟踪是智能监控研究中
由于互联网的普及以及信息科技的高速发展,云计算产业也迅速发展,其典型特征是“按需服务,按量付费”。要保证服务质量,任务调度是关键。一个调度策略的好坏直接影响用户满意