基于神经网络的跨模态多媒体检索方法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:itache
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨模态多媒体检索是信息检索的一个重要研究领域。随着大数据时代的到来,不同模态数据呈爆炸性增长,基于单模态数据的检索已经不能满足人们的需要,跨模态多媒体检索技术应运而生,且正在成为信息检索的新趋势,在理论研究和实际应用方面都有重要的研究意义。跨模态多媒体检索技术,就是建立不同模态数据间的配对关系。本文主要研究跨模态多媒体检索领域中图像与文本互相检索的问题,任务包含两部分:已知查询图像,检索相关文本;已知查询文本,检索相关图像。本文使用深度限制的玻尔兹曼机预训练的稀疏神经网络模型,从以下三个方面探讨神经网络技术在跨模态多媒体检索中的应用,提出如下方法:1.提出一种跨模态多媒体语义匹配(Cross-Media Semantic Matching)方法。该方法使用两个独立的深度神经网络模型将图像和文本的底层特征映射到二者共同的语义空间。具体地,使用训练图像和文本的底层特征以及二者的标签训练两个独立的深度神经网络模型,将测试图像和文本的底层特征输入训练好的两个网络模型中,将其顶层输出作为图像和文本共同的语义空间。方法使用完全的语义信息进行跨媒体检索,不需要对数据底层特征(如线形、边缘或单词、短语等)的明确理解,既考虑了同构媒体数据的语义信息,也考虑了异构媒体数据的语义相关。2.提出一种模态重构的跨模态多媒体检索(Modality-Reconstructed Cross-media Retrieval)方法。该方法使用一个深度神经网络模型将图像的底层特征映射到文本的特征空间中。具体地,使用训练图像和文本的底层特征训练一个深度神经网络模型,将测试图像的底层特征输入训练好的网络模型中,将网络的顶层输出作为文本的特征空间。方法使用深度神经网络将图像的底层特征直接映射到文本的特征空间中,省略了图像和文本间的同构子空间,且不需要大量的标记样例。3.提出一种基于协同深度语义学习的跨模态多媒体检索(Cross-Media Retrieval with Collective Deep Semantic Learning)方法。该方法使用两个深度神经网络模型将图像和文本的底层特征映射到二者共同的语义空间中,且使用协同深度语义学习技术探索无标记数据中潜在的语义信息。具体地,两个互补的深度神经网络首先被训练来协同地将图像和文本样例投影到一个共同表示空间中,基于此,生成无标记图像和文本样例的弱语义标记。然后,把他们和有标记的训练样例再次输入网络模型并训练网络。方法从数据的全局结构信息出发,能挖掘出无标记样例中潜在的语义信息,将无标记样例的弱语义标记协同学习为强语义标记,增强检索模型的类别判别能力以及语义建模能力,并可以发现一个更有意义的语义子空间。
其他文献
基于布里渊光时域分析(BOTDA)的传感技术具有长距离、连续分布式的测量特点,其可在几十公里的光纤上提供高精度的温度和应力传感,特别适用于一些大型土木工程和建筑物的结构
本文是基于JFinal框架将中文分词技术应用到微信订餐导航中,首先对当下几个非常火热的订餐App进行功能上的分析,以及餐饮行业本身的商业特点,制定了相对完善的需求分析,探讨
近几年,中国的区域经济发展不断加快,经济区(经济圈)建设在全国各地方兴未艾,并成为提升区域经济竞争力的强劲动力。在这一背景下,国家规划了18个国家主体功能区,其中就有黔中经济区
互联网的繁荣发展给现代社会带来了深远影响。尤其是在web2.0时代,人们可以在互联网上开展一系列诸如网上购物、网上办公、网上学习等活动。文档、图片、音频、视频等多元的
由于微机电加工技术(MicroElectrical-Mechanical System,MEMS)的飞快发展,微流控技术的研究也开始得到大家广泛的关注。在这最近的三十年里,基于微加工的微流控芯片已经在物
由于气候变化和人类活动的双重影响,淮河流域洪水的形成机制发生了变化,洪水资料产生了不一致性,引发基于统计原理计算的设计洪水可靠性下降。本文以淮河上游为研究对象,开展了变化环境下流域设计洪水修订的研究,提出基于SWAT分布式水文模型构建一致性洪水序列的方法,并根据修订后的洪水序列得到重新计算设计洪水。主要研究内容及成果如下:(1)水文要素变化特征分析。基于长期水文观测资料,研究了淮河上游水文要素的演
随着互联网时代的发展,数字图像在人们日常信息传递中发挥的作用越来越大,高分辨率图像凭借其良好的视觉体验,广泛应用于社会生活的各个领域,但是由于受硬件系统或拍摄环境的
本课题是对基于视觉的多运动物体跟踪关键技术的研究,是在多运动目标检测的基础上,根据目标的不同有效特点及运动趋势,预测未来短时间内目标的运动方向或运动状态,为下一步目
与传统的速调管、行波管、磁控管等器件相比,扩展互作用振荡器在毫米波乃至太赫兹波段可以实现更大的输出功率。由于其具有体积小、结构紧凑等特点,被广泛应用于雷达、电子对
近年来,基于光学相干断层扫描(Optical Coherence Tomography,OCT)图像的疾病探测技术业已成为医学图像处理领域中的研究热点,它是利用计算机技术将OCT图像中的病变区域识别