【摘 要】
:
随着互联网、移动通讯和社交媒体的快速发展,大数据时代已经来临,人们每天都会产生多种媒体数据。如何跨越不同模态数据高效准确地检索出用户所需要的相关内容是一个有重要意义的问题。近年来,跨模态检索在实际生活中有越来越多的应用,如搜索引擎、推荐系统、电子商务等领域,成为研究热点并取得不错的进展。但是跨模态检索仍然存在一些问题,如不同模态数据差异巨大,不同结构的数据存在异质鸿沟不可直接比较;而且在跨模态检索
论文部分内容阅读
随着互联网、移动通讯和社交媒体的快速发展,大数据时代已经来临,人们每天都会产生多种媒体数据。如何跨越不同模态数据高效准确地检索出用户所需要的相关内容是一个有重要意义的问题。近年来,跨模态检索在实际生活中有越来越多的应用,如搜索引擎、推荐系统、电子商务等领域,成为研究热点并取得不错的进展。但是跨模态检索仍然存在一些问题,如不同模态数据差异巨大,不同结构的数据存在异质鸿沟不可直接比较;而且在跨模态检索的实际应用中,查询数据和训练数据的分布也不同,这些都会给检索带来困难。针对模态鸿沟和查询数据分布差异的问题,本文从共享嵌入空间内如何保留相似度减小模态鸿沟的角度切入,结合语义平均嵌入做了深入探索和研究,提出了相应解决方法,并通过一系列实验分析来验证所提方法的有效性,本文主要研究成果如下:1)提出一种基于语义相似度保留学习和平均嵌入的跨模态检索方法。该方法在嵌入子空间中保留嵌入相似度以减小模态鸿沟,同时使用语义平均嵌入提高检索精度和鲁棒性。传统方法主要关注跨模态数据匹配对之间的距离,而忽视了模态内部同种类数据和跨模态不同类数据之间的距离。本文在嵌入空间内对模态内部和模态之间的特征进行距离约束以保留嵌入相似度,使得同类数据聚集在一起,不同类数据分散开以便检索。但是不同类数据并不能完全分开,而且存在远离中心点的异常数据难以检索。因此本文使用查询类的平均嵌入做检索以减弱查询数据差异性带来的影响。2)把本文提出的跨模态检索方法1迁移到多模态检索中。主流跨模态检索方法局限于两个模态,处理多个模态需要把所有模态两两匹配并多次训练模型,较为繁琐。本文把两个模态的嵌入距离约束损失线性的扩展到多模态,大幅降低了损失函数复杂度。本文所设计的模型结构十分简洁,各模态网络相互独立没有复杂的耦合,可以很灵活地迁移至多模态中,只需要训练一次模型便可以实现任意模态的互相检索。3)提出一种基于对抗学习的无监督跨模态检索方法。主流方法常常需要类别信息辅助才能提取比较优良的嵌入特征用于检索,所以针对跨模态检索的无监督方法研究比较少。本文试图在嵌入空间内约束嵌入之间的距离靠近其在原始媒体空间内的距离,以保留语义属性。然后使用模态对抗学习促进不同模态的嵌入特征融为一体,以去除模态固有结构带来的差异性。综上,本文提出的方法可以减弱模态鸿沟问题,所设计的模型有很灵活的扩展性,并丰富了无监督跨模态检索研究方向,在科学研究和实际应用中都有着重要价值。
其他文献
近年来,大型科学计算等专项应用的飞速发展,使得人们对微处理器性能提出了极高的要求。IC(集成电路)行业的发展因此也呈现日新月异的态势。DSP(数字信号处理器)作为数字信号处理系统的“引擎”,因其运行速度快、功耗低以及可编程等优势,广泛应用于数字信号处理、航空航天、多媒体等领域[1]。为提高DSP的峰值运算能效,VLIW(超长指令字)、SIMD(单指令多数据流)及流水线等技术已成为高性能DSP发展的
目的:研究表明,糖尿病对于晚期肺癌患者的预后会产生不良影响,但对于中早期患者,尤其是可行肺癌根治术患者,糖尿病是否会影响其肿瘤的生长及转移,控制血糖是否会增加其手术机会尚且不得而知,本文旨在研究糖尿病对于非小细胞肺癌(Non-Small Cell Cancer,NSCLC)患者预后的不良影响。方法:回顾性分析2014-2018年于我科室就诊肺癌患者857例,记录其入院时年龄、性别、术前血糖、有无严
为顺应时代发展需求培养高质量人才,2017年教育部出台的思想政治课程标准要求构建活动型思想政治课堂实施活动型思想政治课堂教学。活动型思想政治课堂教学以培育学科核心素养为本质追求,具有基于学生本位、促进知行合一、关注活动过程及指向素养目标等特色,能够促进学生的学科核心素养有效落实。本文以马克思主义关于人的全面发展学说、建构主义学习理论等科学理论为理论基础,通过问卷调查和访谈等形式,对目前核心素养教育
1937年抗日战争全面爆发,为躲避战火、维系生存,大批京剧戏班和艺人纷纷南下,其中不乏名家名角儿,作为“大后方”的云南,为他们提供了庇护之所和生存条件。京剧艺人和戏班把京剧流播到包括云南在内的西南地区,丰富的剧目为本土和内地逃难而来的群众提供了重要的娱乐方式,戏班排演的反抗侵略剧目激励了民众抗日的决心和信心,高水平的艺人也影响和促进了地方戏曲的发展。同时,随着局势的变化,针对众多戏班和演出,地方政
随着直流输电和柔性输电的迅猛发展,电力电子技术的应用更为普遍,加上各种非线性负载的大量应用,导致谐波问题在电能质量和电能安全领域内占据了至关重要的地位,对其针对性的
随着煤炭资源开采,东部煤炭资源越来越少;伴随着西部大开发战略的实施,西部煤炭资源的开采被提上日程。其中特厚煤层开采过程中,由于采掘等因素产生的冲击震动对巷道围岩产生破坏的现象经常发生;冲击震动作用下全煤大巷的合理支护已成为煤矿开采的一个难题,研究巷道围岩在冲击震动作用下的破坏机理及冲击震动作用下巷道的合理支护对煤矿安全生产有重要的意义。本文以新疆伊犁一矿为工程背景,对伊犁一矿3煤大巷遇到的冲击震动
目的:结直肠癌是常见的恶性肿瘤,导致肿瘤死亡的第二大原因。结直肠癌侵袭和转移的发生是导致生存率低、死亡率高的主要原因。结直肠癌侵袭和转移的发生原因和机制目前还不是很清楚,所以研究引起结直肠癌发生侵袭转移的分子标志物显的尤为重要。神经前体细胞表达下调蛋白9(NEDD9,又称为HEF1和Cas-L),是一种多结构域的骨架蛋白,在黑色素瘤、肝癌、肺癌和乳腺癌多种肿瘤中呈高表达。本实验研究的目的是通过探究
中小学学业评价改革是基础教育改革的一个重要环节,它不仅关系着学生学业发展和综合素质水平提高,也关系着教师队伍建设和教师专业化水平提升。然而,现阶段我国学生学业评价模式比较单一,评价方法仍然是“静态评价”的方式,不利于践行“发展性评价”理念,也不能满足教育评价改革的现实需要。基于以上问题,本研究试图从我国中小学学业评价改革实际出发,引入在美国具有广泛实践基础的SGP学业评价模型(Student Gr
随着异步电机交流调速的应用越来越广泛,高性能的电机控制系统更受到关注。转速的准确辨识作为提高性能的重要指标,成为研究热点之一。为了实现转速估算时低成本、强适应性以
随着社会信息化进程的日益加快,社会公众对档案信息的需求日益高涨,我国档案事业面临重要转型。特别是近年电子政务的迅猛发展,政府在业务活动中产生了大量的电子文件,这些电子文件是数字档案资源的重要组成内容。与此同时,伴随档案信息化建设的推进以及信息技术的普及和应用,如何实现数字档案资源最大范围的共享,已成为当今学术界及相关部门普遍关注的新问题。广西壮族自治区政府及各级综合档案馆近些年针对数字档案资源共享