论文部分内容阅读
随着多媒体设备、互联网以及云计算等技术的迅速发展与普及,信息社会进入了大数据时代。文本、图像、视频、音频等来源广泛、形式多样的多媒体数据作为信息传播的载体,蕴含着丰富的社会价值与经济价值。如何对这些数据进行高效的分析与管理,从中挖掘出有价值的信息并加以利用,成为社会各界广泛关注并亟待解决的问题。作为数据检索的一种传统方法,哈希算法由于搜索速度快、占用存储空间小等特点,得到了广泛的应用。因此,基于哈希算法的跨模态检索技术具有重要的研究意义。现有的无监督跨模态哈希检索方法更多地关注如何将不同模态的原始数据嵌入到公共低维子空间中,以实现跨模态数据的特征匹配,从而方便进行相似性度量,而对于跨模态数据本身固有的判别性结构信息,并没有充分挖掘利用。本文在深入学习矩阵分解、稀疏子空间学习、协同训练以及图嵌入等相关知识的基础上,针对现有跨模态哈希方法存在的不足,对其进行改进与提升,提取并合理利用跨模态数据固有的结构信息,完善基于协同矩阵分解的跨模态哈希检索框架,主要的研究内容与成果总结如下:1.针对现有协同矩阵分解哈希忽略了数据的模态内相似性保持这一不足,提出一种基于稀疏子空间学习的局部线性跨模态哈希方法。在协同矩阵分解哈希框架的基础上,利用稀疏子空间学习,得到数据局部线性结构的稀疏低维表示,将其作为数据的模态内相似性约束,量化矩阵分解的低维表示系数得到统一的哈希编码。2.为了有效地挖掘跨模态数据本身固有的判别性结构信息,并使不同模态的数据结构信息相互约束,提出一种基于协同训练的矩阵分解跨模态哈希方法。利用协同矩阵分解将不同模态数据映射到公共子空间,得到数据的低维潜在语义表示,同时,通过协同训练方法提取各模态的结构判别信息进一步约束数据的模态间相似性,并利用近邻约束保持数据的模态内相似性,使生成的哈希编码更具判别性。实验结果表明,相比于现有的无监督跨模态哈希方法,本文提出的基于稀疏子空间学习和协同训练的跨模态哈希检索方法提高了检索精度,表现出了良好的检索性能。