在线自监督学习场景适应的单/多目标跟踪算法

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:mayflysnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是计算机视觉领域一个基础性课题,在智能驾驶、安防监控、军事侦察等领域均有着广泛应用。在目标跟踪任务中,影响跟踪性能的主要因素有:目标剧烈形变、目标快速运动、相机抖动、场景遮挡等。本文将对目标跟踪课题开展研究,主要工作可分为算法理论研究和机载系统应用两个部分:在算法理论研究部分,提出基于在线自监督学习的场景适应目标跟踪算法OSATracker。本文对当前主流的基于孪生网络结构的跟踪算法进行深入研究,发现尽管基于大数据离线训练得到的匹配模型具有较强的泛化能力,但是由于在线跟踪过程中目标模板特征易受光照变化、场景遮挡、相机抖动等因素影响,导致模板累积误差随着跟踪时间延长不断变大,故而使得匹配模型无法很好适配当前跟踪场景。本文受到自监督学习的研究思路启发,针对在线跟踪过程数据有限、离线训练得到的孪生网络匹配模型对在线跟踪场景适配度不够的问题,利用模板自身信息设计了自监督学习模块,使得匹配网络在匹配定位结果不准确时,及时对模板特征进行优化调整,矫正目标位置。该结构能够使得匹配网络更关注于当前模板区域的有效特征,提升网络模型对在线跟踪场景的适配性,在不需要对匹配网络模型重新进行离线训练的情况下有效提升了跟踪定位的精度。本算法在OTB2013和OTB2015数据集上的评测结果表明,其跟踪成功率相较于基准算法Siam FC平均提升了1.3%。此外,本文设计了完备的消融实验对自监督学习过程中各项参数对跟踪性能的影响进行了分析。针对机载系统中多目标跟踪任务的需求,即要在硬件低功耗的情况下实现多尺度、多类别的实时多目标跟踪,本文对相关滤波类跟踪算法开展了深入研究,并选取六种经典的相关滤波类的单目标跟踪算法(包括DSST、CN、BACF、SAMF、Staple、KCF等),以它们为基准,采用多线程的方式实现多目标跟踪,可以依据跟踪场景和任务需求选择不同基准算法去执行多目标跟踪任务。此外,本文在无人机采集得到的机载视频数据上对采用不同基准算法执行多目标任务的效果进行可视化对比分析,实验证明本文所采用的方法对于需要跟踪的目标数目较少的多目标跟踪任务需求具有较高的性价比和应用价值。
其他文献
末敏弹对装甲目标的探测多采用复合体制,研究跨波段的毫米波主被动复合探测可有效的探测识别到具有隐身涂层的装甲目标。本文围绕Ka波段和W波段的毫米波,对跨波段复合探测开展研究。本文主要研究内容为:(1)针对装甲目标多采用隐身涂层来降低末敏弹探测效能的情况,本文对典型装甲目标进行建模,对其有无隐身涂层时的雷达散射截面积(RCS)和辐射温度特性和隐身涂层材料的辐射率变化进行了仿真。围绕仿真结果,进行了基于
结构色是一种通过亚波长人工微纳结构与可见光相互作用而显示的物理颜色,相比传统颜料色具有色彩鲜艳、化学性能稳定、易回收无污染等优势。结构色能够突破可见光衍射极限,实现100,000 dpi的超高分辨率,对于高分辨率高性能显示以及高密度光学数据储存等相关领域具有广泛的应用前景。传统结构色设计需要通过电磁仿真方法验证并不断重复优化,这一过程需要消耗大量时间及计算资源并且可能仍然无法准确满足设计需要。人工
相较传统的相控阵雷达,数字多波束雷达在数字域对波束进行合成,波束合成的一致性较好,且具有更高的波束指向精度,因此受到国内外学者的高度关注,具有广泛的应用前景。论文研究的是基于现场可编程门阵列(Field Programmable Gate Array,FPGA)的数字多波束雷达信号处理系统,并对其进行设计及实现。论文首先介绍数字多波束雷达的研究背景以及雷达信号处理的相关算法;其次,根据系统功能需求
为了保证燃油箱在战场上能够满足特种车辆的功能需求,避免因为各种威胁对油箱造成损伤,导致油箱燃料泄漏无法正常完成工作,甚至发生燃烧爆炸带来二次损伤,提高特种车辆油箱的防护性能是亟待解决的问题。基于此,本文提出通过聚脲涂覆钢板的复合结构设计了安全油箱防护结构的方案,然后通过理论分析,数值仿真模拟和试验验证各种技术,对安全油箱防护结构的自密封性能和抗冲击性能进行研究,证明了安全油箱防护结构确实能有效提高
自适应数字波束形成(Digital Beamforming,DBF)技术可以通过最优化理论实现空域干扰的自适应抑制,对于雷达、声纳等需要在复杂电磁环境中进行目标的探测和跟踪的电子系统具有重要的研究意义。然而,实际系统存在各种非理想因素,比如阵列互耦、导向性矢量失配和协方差矩阵估计误差等,都会导致自适应数字波束形成算法性能显著下降。本文针对上述问题,并针对大规模数字阵列自适应DBF算法的实际需要,开
目前,许多国内研究者针对用来清除太空碎片的空间飞网捕获技术展开了大量的研究,但大都是关于绳网动态仿真方面的,如何获得地面模拟试验的数据来验证碎片清除模拟器的可靠性也是值得探索的,鉴于该研究背景,主要以柔性绳网为研究对象,对网展开飞行试验中的三维轨迹重构过程进行研究,提出了一种基于双目立体系统的三维信息测量装置及三维轨迹重构的方法,获得的数据可用来验证模拟器。先针对柔性飞网所拍摄的复杂环境,搭建了灵
重复性电磁结构在实际工程中有着极大的应用,然而对其进行全波仿真计算成本太高,因此寻求准确、高效的求解方法对指导重复性结构的设计极具理论与现实意义。特征模方法自提出以来一直在电磁学领域受到广泛的关注,由于特征模只与目标固有的物理属性有关,与外加激励无关,且模式之间具有天然的正交性,因此非常适合作为目标的全域基函数来展开表面电流。再通过少数模式截断,减少待求未知量,提高目标电磁问题的计算效率。本文主要
同步定位与建图(Simultaneous Localization and Mapping,SLAM)是机器人自主执行任务的基本前提。视觉SLAM具有丰富的图像表示,但无法鲁棒地应用于特征稀疏的场景;惯性测量单元(Inertial Measurement Unit,IMU)虽然能提供可靠的横滚角和俯仰角测量值,但长时间累计漂移误差大,不能单独用于长期运动状态估计。由于视觉传感器和IMU两者具有良好
中文生物医学文本的命名实体识别和规范化在信息抽取的下游任务和构建中文医学知识图谱等方面发挥着重要的作用。随着医学文献数量迅速累积和电子病历的广泛使用,从海量的医学数据中挖掘有用的信息并进一步分析就需要依托于实体识别和规范化技术。然而,往往中文文本的结构比英文文本结构更复杂,分词的方案较英文更为复杂,并且因词语错分而导致语义误差的传递问题难以得到解决,非医学类的信息抽取技术效果也比医学类的效果更好,
由于细粒度图像其不同类别之间的差异较小,需要大量精细的人工标注数据用于训练,但是这类数据的标注任务耗时且需要相关专业人员进行。为了解决这个问题,本文将互联网上获取的图像作为训练集用于细粒度图像分类。由于网络数据集中含有大量标签噪声,如果直接用于神经网络训练,反而导致较差的分类效果。因此本文通过去除噪声图像或修正图像的噪声标签,让深度神经网络在网络数据集上进行鲁棒地学习,主要开展的研究工作如下:1.