【摘 要】
:
结合可见光图像和红外图像的多模态目标跟踪能够极大地扩展目标跟踪的适用场景,突破单数据源对环境和目标信息量的限制,因此该任务在近年来逐渐获得关注。同时,在公开且统一的数据集和评价方法的基础上,深度学习在多模态数据利用上的潜力被逐渐发掘。在相关工作的推动下,多模态目标跟踪算法不断取得精度突破,但仍然存在严峻的挑战,特别是对多模态图像中不稳定信息的联合感知。本文针对多模态图像中信息的综合感知和联合建模展
论文部分内容阅读
结合可见光图像和红外图像的多模态目标跟踪能够极大地扩展目标跟踪的适用场景,突破单数据源对环境和目标信息量的限制,因此该任务在近年来逐渐获得关注。同时,在公开且统一的数据集和评价方法的基础上,深度学习在多模态数据利用上的潜力被逐渐发掘。在相关工作的推动下,多模态目标跟踪算法不断取得精度突破,但仍然存在严峻的挑战,特别是对多模态图像中不稳定信息的联合感知。本文针对多模态图像中信息的综合感知和联合建模展开研究,构建基于孪生神经网络的多模态目标跟踪器,并对其中的特征聚合进行深入研究。本文以注意力机制为工具,探索注意力引导的多模态深度特征的提取、交互、增强、融合方法,分别提出了基于跨模态注意力查询的交互与增强方法、基于多级残差注意力和特征选择的提取与融合方法,以提高多源数据的综合利用率。本文的主要研究内容如下:(1)针对多模态数据构建基于孪生神经网络的多模态目标跟踪模型。首先,研究基于孪生网络的目标跟踪理论,然后结合多模态数据搭建跟踪框架,其次利用实验说明了大规模跨数据的预训练在多模态跟踪框架下的有效性。(2)设计了一种跨模态注意力查询模型,并结合基于特征解耦的三元网络和余弦嵌入损失,实现模态特征的自增强和互增强。通过注意力机制使模态特征间相互查询、感知互补信息,并进行相应的特征增强。实验表明特征的差异化学习、模态的交叉感知与增强的有效性,提高了跟踪精确率、成功率以及速度;模型在RGBT234数据集上精确率和成功率分别达到73.4%和52.0%,在Las He R数据集上精确率和成功率分别达到43.7%和32.1%,以及75 FPS的跟踪速度。(3)针对跨模态特征提取和融合过程,设计了基于加权残差注意力的多级交互结构和基于特征选择的自适应特征融合模型。通过深度网络的多级交互实现不同层次的跨模态信息感知和流动。利用注意力机制实现自适应特征筛选,并用于融合同模态的分离特征和跨模态的差异化特征。实验表明上述模型促进了多模态特征的表达与融合,在保持跟踪速度的前提下,进一步提升了多模态目标跟踪的效果。模型在RGBT234数据集上精确率和成功率分别达到76.8%和52.5%,在Las He R数据集上精确率和成功率分别达到47.4%和34.7%,以及65 FPS的跟踪速度。
其他文献
党的十九大以来,职业经理人选聘制度的推行逐渐进入关键时期,成为完成国企改革“三年行动”重要任务的热点问题。本文依据中国建材集团有限公司实施职业经理人选聘制度的典型案例资料,分析我国国企推行职业经理人选聘制度的现状和主要困境,并提出优化建议,以期为国有企业职业经理人选聘制度的全面推行提供一定借鉴。
纯无机钙钛矿材料具有颜色可调、带隙窄、制作工艺简单、成本低等优点,受到了广泛的研究,然而它在水和氧环境中的不稳定性限制了其应用。利用聚合物在非极性溶剂中的溶胀-收缩原理将CsPbBr3量子点原位生长在聚甲基丙烯酸甲酯(PMMA)薄膜中来提高钙钛矿量子点在水氧环境中的稳定性。该方法合成简便,可以降低CsPbBr3量子点的形成温度,并且可以得到稳定的钙钛矿相薄膜,制得的复合薄膜具有优异的空气稳定性和耐
近年来,随着智能监控系统的不断升级和广泛应用,行人重识别技术受到了众多学者的关注。得益于可见光摄像头和红外摄像头的大量部署,面向红外图像和可见光图像的跨模态行人重识别研究得到了长足的发展。跨模态行人重识别旨在匹配不同场景下具有相同身份的红外图像和可见光图像,由于红外模态和可见光模态之间存在巨大差异,所以如何减小跨模态差异是跨模态行人重识别研究的重点。随着跨模态行人重识别研究日趋成熟,基于模态互转的
大型LNG储罐是LNG生产企业和LNG接收站中最为关键的储存设施之一,其整体投资相对较高。由于LNG温度超低,当大量的LNG进入到常温储罐后会导致其内部出现的非均匀性温度骤降,不仅会导致储罐内部的压力迅速升高,同时也会导致罐体出现明显的应力集中现象,从而对储罐的安全性产生巨大威胁。因此在正式通入LNG前需要对大型LNG储罐进行预冷,即通过预冷将储罐由常温状态缓慢且均匀的降低至低温状态,以避免储罐内
“情状(situation)”研究的是动词的时间结构。文章把《史记》的1002个单音节动词(或义位)分别归于“活动”“状态”“达成”“瞬成”四个情状类型,并对四个类型相关的一些问题进行了讨论。
随着人们的生活水平日益提高,部分学校由于受传统教育理念的影响,并不重视小学体育教学,使得小学生在成长过程中不注意保护眼睛,不注意锻炼身体等,从而对他们的健康发展产生了不利的影响。在这一背景下,对小学体育教学方法的创新进行探究,以期为小学体育教学提供参考和借鉴。
<正>李文林教授在《数学史概论》中指出:"数学史无论对于深刻认识作为科学的数学本身,还是全面了解整个人类文明的发展都具有重要意义."数学史并不是单纯的将历朝历代的数学成就一一记录在其中,它并不是一部普通的编年史.数学史可以让我们了解数学创造的真实过程,向学生讲授相关的内容,借此发挥数学史知识所内在的育人价值,汲取数学家探索真理的力量.不了解数学史就不可能全面的了解数学科学.《义务教育数学课程标准(
<正>为深化高考考试内容改革,教育部考试中心研制发布了《中国高考评价体系》(以下简称“高考评价体系”).高考评价体系是教育评价的理论和实践体系,也是高考命题、评价的重要依据.针对高考中“如何考”的问题,高考评价体系明确提出了“四翼”的考查要求,即“基础性、综合性、应用性、创新性”[1].“四翼”在高考评价体系的落实中居于关键位置,
以忻州市古树为研究对象,探讨了古树资源类型和分布。结果表明:忻州散生古树以油松、国槐、侧柏、榆树、旱柳和楸树为主,占总株数的81.94%,树种之间的数量差异悬殊,松槐柏榆为优势树种。散生单株古树及古树群总体上呈东多西少特征,主要生长于传统村落四旁和寺庙中,居住民俗影响着树种在微生境的分布。忻州散生树种树龄结构,一级、二级和三级分别占27.8%、28.6%和43.6%。油松、国槐、侧柏、楸树和枣树等
<正> 两年前笔者曾治一例妊娠水肿,其中之教训至今难以忘却。特录之于下,以就正于同道。李×,女,31岁,农民。初诊:1978年9月21日。妊娠8个月,双下肢高度浮肿月余,前医曾投全生白术散数剂不应,求治于余。诊见:病者苦于足肿被迫仰卧睡椅之上,双足垂地,挪动困难,生活不能自理。浮肿起自大腿延至足趾,按之凹陷,并有低热,咳嗽少痰,小便短少,大便尚可,舌淡苔少,脉滑。因视其肿势骇然,以为前医所投病重药