【摘 要】
:
跨模态检索是指以一种模态数据作为查询条件来检索另一种模态的相关数据。现阶段的跨模态检索模型在数据的特征提取、不同模态数据间的交互以及相似度计算等方面仍存在提升的空间。因此本文尝试将多模态预训练模型应用于跨模态检索任务中,进一步提升跨模态检索的效果。本文的主要研究工作可以概括为以下三点:(1)基于公共空间特征学习的跨模态检索方法。该方法首先利用目标检测模型提取图像感兴趣的区域特征,然后利用语言模型提
论文部分内容阅读
跨模态检索是指以一种模态数据作为查询条件来检索另一种模态的相关数据。现阶段的跨模态检索模型在数据的特征提取、不同模态数据间的交互以及相似度计算等方面仍存在提升的空间。因此本文尝试将多模态预训练模型应用于跨模态检索任务中,进一步提升跨模态检索的效果。本文的主要研究工作可以概括为以下三点:(1)基于公共空间特征学习的跨模态检索方法。该方法首先利用目标检测模型提取图像感兴趣的区域特征,然后利用语言模型提取文本的单词特征,随后利用图文协同注意力机制完成图文数据的交互,学习到图像和文本数据的对齐关系,生成图像和文本的全局表示,用于计算不同模态数据之间的相似度,利用度量学习来缩小不同模态相似样本对间的距离,扩大不同模态不相似样本对之间的距离。最后通过对相似度排序返回相似度最高的结果作为跨模态检索的结果。本方法的跨模态检索效果显著优于传统的公共子空间方法。(2)基于多层次特征融合的跨模态检索方法。鉴于多模态预训练模型强大的特征表示能力,分别利用单流、双流的多模态预训练模型对图像和文本数据进行编码,并比较了这两者模型的差异性。利用相似度特征融合模块成功地捕捉了图文数据细粒度的对齐关系,并利用无关词汇过滤提高相似度计算的准确性。该方法的跨模态检索效果较基于公共空间特征学习的跨模态检索方法有一定的提升。(3)基于图网络和对比学习的跨模态检索方法。将图神经网络应用于跨模态检索领域。利用图文数据的局部相似度向量和全局相似度向量作为图的结点构建一个完全图,利用GCN来更新图的节点从而完成相似度的推理,得到最终的图文相似度。该方法捕捉了图文数据更为全面的关联关系。然后利用重写文本描述的方法构造了图像数据对应的文本负样例,完成了数据的增强,最后利用对比学习对模型进行训练。该方法达到了本文所用方法中的最好效果,证明了图神经网络和对比学习在跨模态检索应用中的有效性。
其他文献
氮氧化物NOx是大气污染的重要来源,选择性催化还原技术(NH3-SCR)是应用最广泛的NOx控制技术之一,其关键在于开发低成本、高性能的催化剂材料。钒钨钛基催化剂虽工业化应用多年,但操作温度高(300-400℃)、成本高、易被烟气中SO2毒化,不适用于烟气温度较低的非电力行业工业锅炉和窑炉。以活性焦(炭)为代表的非金属碳材料成本低、比表面积高、结构可调性好,是具有潜力的低温NH3-SCR催化剂。但
随着“双碳”的提出,我国对能源的需求量不断增大,如何提高能源利用率成为当务之急。高效储能传热系统是解决能源利用率低下的有效方法之一,其关键在于开发新型的储热换热工质以满足其需求。潜热型功能热流体作为一种高潜热流动工质,可有效的强化设备吸换热,在能源领域具有巨大应用潜力。本文以潜热型功能热流体为研究对象,制备高潜热相变微胶囊和导热增强型潜热型功能热流体,开展其在矩形截面微通道内的流动传热特性研究。基
重型燃气轮机代表了一个国家的工业发展能力,彰显着国家的高科技实力,具有极其重要的战略地位。为了向大参数、高性能目标发展,燃气温度在不断升高,但同时高温也成为了影响重型燃气轮机安全稳定运行的一大因素,而高温环境下的辐射效应是不可忽视的。近几年受“双碳”政策的影响,氢混燃气轮机的发展逐渐受到重视,因氢气的绝热燃烧温度更高,辐射效应对燃气轮机的影响会更加突出。因此开展氢混燃气轮机燃烧室内辐射热环境的研究
图数据不仅包含每个样本点的特征,并且往往会包含大量样本点的关系数据,而这些数据具有很高的价值。图机器学习就是将机器学习技术应用于图数据。图机器学习提供了充分利用这些关系数据的办法,它使得在考虑图中每个节点的自身特征的同时,考虑邻节点以及邻节点的特征,这样就能够获取更好的性能。本文所研究的内容基于一种图机器学习的新方法——图扩散卷积。这是一种对于图结构的预处理方法,其原理为按照一定的系数将某节点的高
鸟类的婚配制度复杂多样(单配制、一雌多雄制、一雄多雌制和混交制),而亲代抚育的投入在婚配关系的进化中发挥重要作用。巢寄生鸟类雌雄个体均不参与亲代抚育,为探索鸟类特殊婚配关系提供了一个独特的机会。关于巢寄生鸟类的领域行为的研究结果不尽相同,根据子代的亲子鉴定判断产卵区的空间分布对于了解雌雄个体的领域行为具有重要的价值,并且还有助于了解空间利用模式对婚配关系的影响。大杜鹃(Cuculus canoru
采用离心和丙酮萃取的方法,对焊锡膏中的金属粉和助焊剂进行初步分离,再通过闪蒸、固相微萃取、热裂解及甲酯化等不同进样方式,进行气质联用(GC-MS)分析测试,对焊锡膏的助焊剂成分进行定性分析。结果表明:通过该方法能有效分析出助焊剂中所包括的绝大部分溶剂、活性剂、缓蚀剂及部分添加剂,而松香由于其种类繁多和异构体较多导致结构差异较小,暂时无法确定具体类别,触变剂因其在甲醇中溶解性差使得甲酯化效果不好和热
近年来,计算服务化的发展为互联网带来的众多虚拟服务,极大丰富了人们生活。但种类繁多的海量服务导致了服务供需不匹配问题,用户面向多领域的复杂需求为服务的精确匹配带来了挑战。解决服务精准匹配问题的第一步是获取用户完整需求。用户需求作为连接用户与服务提供者的关键,能够实现服务供需匹配的解耦。随着人工智能技术的发展,基于人机对话交互的方式来向用户提供服务的软服务机器人正逐渐成为研究热点。作为用户与服务提供
近年来,随着国际形势的日益严峻,具有自主知识产权的工业软件开发对我国各个产业都至关重要。本文根据相关工业技术的发展需求,针对三维复杂结构非稳态导热分析的自主知识产权的仿真软件开发与对流边界换热系数的辨识问题开展了系统研究。以任意复杂结构三维非稳态导热仿真分析为目标,从核心求解器算法与代码、前后处理模块和数据接口几方面开展研究。采用有限体积法、结构化与非结构化网格系统,实现了任意结构三维非稳态导热过
在信息爆炸的时代,各种成像技术迅速发展。红外传感器具有可以在可见度极差的情况下工作和抗干扰能力强等优点,在现代高科技领域发挥着越来越重要的作用,具有十分广阔的发展和应用前景。另一方面,红外图像也存在空间分辨率低和边缘模糊等缺点。因此,红外图像的分析与处理就成为红外图像及其应用中的研究热点。本课题主要研究内容是红外与可见光图像融合研究以及红外图像超分辨率研究。(1)红外与可见光图像融合。红外与可见光
精神障碍是抑郁症的主要特征,严重的精神障碍和高自杀倾向已经成为社会和个人的沉重负担。虽然一些抗抑郁药目前在临床治疗中能有效缓解抑郁症状,但仍存在起效延迟、部分患者敏感性低、副作用明显等一系列局限性。因而,寻找更有效的抗抑郁药物,对于抑郁症的治疗和预防来说是十分必要的。萝卜硫素(Sulforaphane,SFN)是抑郁症的潜在治疗药物,因此我们通过慢性不可预测轻度应激(Chronic Unpredi