基于稀疏编码哈希的跨模多媒体检索

来源 :安徽大学 | 被引量 : 0次 | 上传用户:fw1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多媒体检索中,基于哈希的相似检索是一种非常有效的跨模检索方法,已经得到了广泛的关注。跨模检索的核心问题就是怎样在多模态数据的不同特征表示之间构建相关性。跨模检索(Cross-Modal Retrieval)的目标是为了可以在不同模态数据之间进行检索。跨模哈希(Cross-Modal Hashing)是将不同模态的数据映射到同一个低维度的Hamming空间中。由于不同维度的多媒体的数据特征表示都最终转化成了相同维度下的二进制表示,因此跨模哈希可以实现不同模态数据之间的高效检索。类似于典型相关分析(CCA),大多数现有的跨模哈希多媒体检索方法是为了用来实现来自相同模态或者相同视角内的数据之间的检索,它们通过线性映射将不同模态的数据特征映射到一个共同的抽象空间中。但是,这种方法不能很好地消除不同模态数据间的语义鸿沟,而提取到更高级别的语义信息可以更加有利于检索。为了解决这个问题,本文中,提出了一种新的检索方法,稀疏编码哈希,同时对该检索方法进行实验论证,并得出了相应的实验结果。主要内容如下:通过使用稀疏编码哈希来进行跨模多媒体检索,首先使用稀疏编码来获取图像与文本的显著特征和潜在语义概念,然后将学习到的潜在语义特征映射到共同的抽象空间,再通过迭代机制,找到多模态数据特征表示间的相关性,最后通过更高级别抽象空间的量化得到统一的哈希编码。同时,本文通过结合SLEP(有效映射稀疏学习)和拉格朗日对偶来求解目标函数,将一个含有五个矩阵变量的非凸性的优化问题转化为只含有四个矩阵变量的凸性问题,这样目标函数的优化问题就可以通过一步一步的迭代直到目标函数收敛。为了验证本算法的有效性,本文选择了Wiki数据集和NUS-WIDE数据集进行了实验,实验结果表明,在Wiki数据集和NUS-WIDE数据集中该算法显示出了它的优越性和稳定的性能。
其他文献
能源问题是关系国计民生的大事,石油在我们的日常生活中起着越来越重要的作用,石油的准确勘探对我们有着重要的意义。要实现精确的石油勘探,首先就要处理大量的地震波信号,而
目前,网络的宽带化、业务多样化使得无线网络处于快速地发展之中,但是现有的固定频谱管理模式使得无线网络频谱资源日益匮乏。动态变化的异构网络环境,更加加剧了业务需求和资源
近些年来,随着无线移动通信技术的高速发展,人们的生产和生活发生了翻天覆地的变化。无线Mesh网络(Wireless Mesh Networks,WMN)作为一种宽带无线网络结构,因其自组织、自愈
传统网络的原始设计方案存在着移动性、安全性方面的问题,一种网络支持一种主要服务的解耦模式也无法满足网络及服务的多样性需求。同时,在传输层面和服务层面均存在网络资源
网络投影仪以其独特的优势在近几年的发展中越来越受到大众的喜爱,而对一个设备实现远程操控也是目前的一个趋势。能够通过一个使用方便、功能齐全、性能良好的管理终端来实现
自动聚焦技术是现代高速信息化社会获取清晰图像必不可少的工具,聚焦技术的发展经历了由手动方式到自动方式,由主动式到被动式的转变过程。近年来,伴随信息数字化的兴起,基于
近年来,认知无线网络技术得到快速发展。在认知无线网络中,二级用户不断的探测可用的频谱,在不干扰主用户的情况下,机会的接入和使用频谱。路由和频谱分配作为认知无线网络最为重
学位
高光谱遥感技术已经成为遥感发展的前沿,并且在民用以及军用等多个领域发挥着极其重要的作用。高光谱图像的高分辨率、多波段数、窄波段宽度、大数据量在为人类带来巨大的研究价值的同时,也给高光谱图像的处理带来了巨大的挑战。多光谱图像的处理方法不再适用于高光谱图像处理,如何从高光谱数据中快速而准确的挖掘出所需要的信息,目前仍是一个亟待解决的问题。高光谱图像分类是高光谱应用中的核心技术之一,快速、高精度的高光谱
在这个信息高速发展的时代,伴随着有线网络的大规模应用,拥有着可移动性、灵活性、安装方便等优点的无线网络技术也在高速的发展着。无线局域网是计算机网络与无线通信技术相结