【摘 要】
:
相对于单一模态检索,跨模态检索能够实现不同模态间的相互检索,更加方便灵活,但多媒体数据的海量特征和多样性为跨模态检索带来巨大挑战。模态的不同意味着特征表示和特征分布的不同,不能直接进行比较。因此,如何在保证检索结果多样性和准确性的前提下,实现大规模的跨模态检索任务是目前多媒体检索领域值得研究的问题。本文针对图像和文本两种模态数据的多标签跨模态检索进行深入研究,利用基于深度学习的实值共同空间学习方法
论文部分内容阅读
相对于单一模态检索,跨模态检索能够实现不同模态间的相互检索,更加方便灵活,但多媒体数据的海量特征和多样性为跨模态检索带来巨大挑战。模态的不同意味着特征表示和特征分布的不同,不能直接进行比较。因此,如何在保证检索结果多样性和准确性的前提下,实现大规模的跨模态检索任务是目前多媒体检索领域值得研究的问题。本文针对图像和文本两种模态数据的多标签跨模态检索进行深入研究,利用基于深度学习的实值共同空间学习方法,缓解目前多标签跨模态方法中语义类别信息使用不充分、多模态数据相似性量化不足、共同表征相似性排序不友好等问题,并分别提出了对应的方法和策略。本文主要内容和创新如下:(1)提出一种基于图卷积的共同表征语义类别关系结构保留方法。利用图卷积网络从类别标签的关系图中获取多个分类器,这些分类器保留了类别依赖关系,并作用于多模态数据的共同表征,从而在标签空间中保持语义类别的关系结构,促使共同表征具有判别性,同时从语义类别的关系中挖掘样本间的潜在关联;(2)提出一种多模态数据相似性度量方法。基于类别标签的共享次数,对多模态数据间的相似度进行多级量化,并进一步融合视觉特征和文本高层语义特征的相似性,构建区分相似性程度的相似性矩阵;(3)提出一种基于成对约束的共同表征相似性排序方法。基于相似性矩阵设置动态边界阈值,在将模态数据的原始特征映射到共同空间中时,约束共同表征之间的距离根据相似性大小排序,从而保留共同表征的语义排序结构,促使检索结果能按相似性大小顺序返回;(4)在上述三点基础上,本文提出一种针对图像和文本两种模态的保留语义顺序结构的共同空间学习方法(Common Space Learning with Semantic Ranking Structure Preserving,SRSP),构建了深度跨模态检索框架。SRSP能够使共同表征在保留相似性排序结构的同时,又在具有语义判别性的基础上保留语义类别的关系结构。通过在MS COCO和NUS-WIDE两个跨模态检索数据集上的剥离实验和对比实验,证明了SRSP的有效性和优越性。
其他文献
为提高冬季大棚蔬菜产量,提早上市,研究补光灯对各种蔬菜生长的影响。试验结果表明,补光灯对植物生长、干物质的生成作用,使作物产量增加,增加收入,不同的作物增产不一样。
在工业4.0和“中国制造2025”的时代背景下,制造业蓬勃发展,机器人的使用愈加广泛,作业场景也愈加复杂多变,相应地对机器人编程技术提出更高的要求。针对现有的示教编程和离线编程在复杂曲线加工程序生成中操作繁琐、使用困难的问题,本文研究面向复杂曲线加工的机器人离线自动编程技术,提高编程效率和编程质量。圆管相贯线是复杂曲线的主要形式之一,广泛存在于核电、管道工程、石油化工等领域,且数量巨大。因此,本文
如何在现有资源环境约束下,既保证生态保护的迫切要求,又保证对建设用地的需求,同时实现保护耕地、合理补充耕地的目标,是陕西省延安市各级政府和研究人员当下关注的重点问题。在延安市推行全域土地综合整治,既能有效缓解“双保”压力,又能为区域发展提供新的突破口。基于此,对延安市推行全域土地综合整治的主要任务、支持政策、实施模式等进行研究,以期为相关部门和人员开展全域土地综合整治工作提供借鉴。
糖度是西瓜分级的重要指标之一,针对传统西瓜检测方法的弊端,探讨了声学特性结合机器学习用于西瓜无损检测与分级的可行性。设计了西瓜声学检测系统,采集了不同批次样本的时域信号。时域信号经归一化处理后,采用快速傅里叶变换得到频域信号,并对其进行去趋势预处理。采用主成分分析提取了频域信号主成分,其中前3个主成分累计方差贡献率为95.32%,第1主成分和第2主成分对不同等级样本具有可分性。利用4种不同的机器学
随着经济多元和公司治理法制化的不断投入,上市公司越来越认识到人才对于一个公司的重要性,所以现如今,如何留住人才已经成为了热议的话题。所以产生了股权激励这一概念。而这一概念的产生时间源于二十世纪的九十年代,而随后的发展则在股权分置改革推出也就是2006年的时候,这个改革的推出,以及当时的大环境中又推出了很多利于公司实行这一概念的法律。所以正是因为如此,我们可以看到有越来越多的业绩发展良好想更加积极发
厘清我国能源高质量发展水平和地区差距的空间演变态势是推进能源革命的关键环节。以构建清洁低碳、安全高效的现代能源体系为导向,建立能源高质量发展水平综合评价指标体系;将我国29个省份(不包括港澳台、西藏、海南)划为东北、东部、中部、西部四个区域,运用投影寻踪评价模型对2010—2017年各省份的能源高质量发展水平进行测度,分析能源高质量发展水平的时序演变;运用Dagum基尼系数及其分解方法,对能源高质
<正>2021年以来,中国工商银行广东佛山分行(以下简称“佛山分行”)认真落实总省行党委工作思路,紧扣高质量发展主题,结合佛山地区实际情况,围绕重点场景建设和织网补网、客户拓面提质等工作要求,在巩固优势的基础上进一步扩大成果。结合佛山地区业务实际,坚持均衡性、可持续性、稳定性,积极探索一条可复制推广的GBC“佛山经验”。
研究目的:体育考古学是根据古代人类体育活动遗留下来的实物史料,研究人类古代体育情况或人类古代社会体育历史的一门科学,其发展对拓展体育史学和考古学研究均有积极意义。通过对我国体育考古学的发展历程、现状及存在的问题进行梳理与分析,并针对我国体育考古学的未来发展提出相应对策和建议。研究方法:文献资料法、专家访谈法研究结果:一、我国体育考古学的发展历程与现状:我国体育考古学肇始于上世纪50年代。1956年
支付宝等互联网金融企业推出的理财产品网络基因较强,圈粉了商业银行众多长尾客户群,抢占了包括AY银行在内的商业银行理财产品增长份额;利率市场化压缩了商业银行的利润空间,倒逼商业银行必须做大理财产品销售规模,以弥补被压缩的利润空间,而传统的理财产品线下网点营销模式已经到了瓶颈;AY银行理财产品业务发展缓慢,理财资金规模、理财客户数量长期处于低水平增长状态。因此,AY银行必须加强理财产品网络营销,及时调
高职护理专业重视护理知识与技能教育,却忽略了护理专业学生思想行为方面的教育。基于此,本文明确高职护理专业教育中,道德规范和护理价值观的价值,分析道德规范和护理价值观教育的现状,创新道德规范和护理价值观教育的路径,进而加强护理道德规范和护理价值观培育,提升护理专业学生的行为规范和思想境界。