【摘 要】
:
目标跟踪是计算机视觉领域的一个重要研究问题,在智能监控、自动驾驶、人机交互以及国防军事等领域都有着广阔的前景与需求。目标在运动过程中的形变、视点变化、遮挡和运动模糊等因素为目标跟踪领域带来许多挑战。基于多域卷积神经网络的目标跟踪方法(MDNet)因其适用于跟踪问题的多域网络结构及良好的性能表现受到了广泛的关注,但仍面临着模型训练速度慢及泛化性能弱的缺点。本文以MDNet及其改进跟踪模型为研究对象,
论文部分内容阅读
目标跟踪是计算机视觉领域的一个重要研究问题,在智能监控、自动驾驶、人机交互以及国防军事等领域都有着广阔的前景与需求。目标在运动过程中的形变、视点变化、遮挡和运动模糊等因素为目标跟踪领域带来许多挑战。基于多域卷积神经网络的目标跟踪方法(MDNet)因其适用于跟踪问题的多域网络结构及良好的性能表现受到了广泛的关注,但仍面临着模型训练速度慢及泛化性能弱的缺点。本文以MDNet及其改进跟踪模型为研究对象,结合基于深度学习模型的元学习方法,利用其快速自适应能力的优势,学习更具判别能力和泛化能力的深度特征,进而提升跟踪性能。本文主要研究内容如下:(1)针对预训练集和跟踪视频的域不一致性导致跟踪性能下降的问题,提出了一种基于原型注意力的多域网络目标跟踪方法(Proto-MDNet)。以实时多域网络目标跟踪方法(RT-MDNet)为研究对象,在训练过程中引入原型网络方法使模型具有域自适应性。基于跟踪结果的正负样本得到目标的原型注意力,将其与待跟踪视频的特征图进行逐通道自适应融合,使得模型在大型数据集上得到判别力更强的目标表示,从而提高跟踪算法的性能。在两个跟踪基准数据集上的实验结果表明,提出方法的精度和成功率分别提升了2.2%和2.7%,与其他代表性方法相比也具有竞争的能力。(2)针对模型不可知元学习(MAML)方法的随机初始化网络头限制性能的问题,提出了一种基于线性判别式初始化分类器头的改进方法(HILDE-MAML)。该方法利用线性岭回归模型的闭式解初始化内循环分类器头,且采用了Woodbury理论,显著降低解模型中矩阵求逆的计算复杂度,使求解速度大幅提升。具有闭式解的初始化分类器头使MAML可以快速学习以适应新任务,同时防止优化器在初始迭代中过分关注分类器的更新,从而加强面向通用特征的网络体参数更新。在四个小样本学习基准数据集上的实验结果表明,该方法显著地改进了MAML及其变体算法MAML++的性能,也优于元学习领域的其它代表性方法。(3)针对基于MDNet的元跟踪器(Meta-Tracker)中使用随机初始化导致不能快速适应新任务的问题,提出了一种基于线性判别初始化元学习的多域网络跟踪方法(HILDESDNet)。采用线性判别初始化头代替原始的随机初始化头,可以快速适应新任务学习,同时增强跟踪模型对目标形变的鲁棒性。实验结果表明,该方法提高了跟踪器的初始化速度,同时具有更好的跟踪性能。
其他文献
近些年来在畜牧业养殖领域,利用深度学习方法完成目标检测、目标跟踪(例如奶山羊目标跟踪)进而实现智能化畜牧养殖管理逐渐成为一种潮流。但深度学习在训练网络时往往需要大量的训练图像,否则会出现网络泛化能力弱、鲁棒性差等问题。而针对现有的奶山羊训练图像数量不足的问题,本文以西北农林科技大学畜牧教学基地采集到的五类奶山羊图像为训练数据集,利用半监督式的对抗神经网络,通过在训练过程中引入训练标签,来生成指定类
农业化肥和食品添加剂过度使用导致的亚硝酸盐污染,对生态环境和公众健康造成了严重的危害。人体若摄入少量亚硝酸盐可能导致急性中毒,若接触过量可致癌甚至死亡。因此,准确、定量监测食品中亚硝酸盐浓度对保证食品质量安全以及维护人体健康有重要意义。与传统检测方法相比,亚硝酸盐电化学传感因其操作简单、灵敏度高、分析速度快,以及可以实现小型化现场分析等优势,受到人们广泛的关注。商业碳纤维纸(CFP)因其良好的导电
水利闸门在日常使用过程中不仅直接影响着防洪防涝的安全,而且与水力发电的发电效益有着极大的关系。在闸门使用过程中,如何获取以及使用水利相关信息,并且妥善解决各种矛盾冲突,合理进行闸门控制指挥决策有着重大意义。在确保没有洪涝灾害的前提下,进行水利枢纽的实时调度,获得最大的水利枢纽运行的综合效益,是目前水利枢纽闸门自动化系统迫切需要得到解决的重要问题之一。与此同时,闸门的安全运行更是保障这些任务能够稳固
非均匀沙推移质是河道中泥沙输移的重要组成部分,直接影响河流中的水流结构、泥沙输移、河床演变等基础问题,正确认识非均匀沙推移质的运动规律是合理开发和保护河流的前提,对于促进河流动力学的发展以及满足实际工程需求都具有十分重要的意义。本文应用高速摄影技术与数字图像处理技术相结合的方法研究了非均匀沙的运动特性。主要内容有以下几点:(1)提出了利用数字图像处理与运动目标检测技术相结合的获取泥沙颗粒运动参数的
近年来,随着计算机性能的不断提升,计算机视觉领域得到迅速发展,基于计算机视觉的三维重建成为一个重要的研究方向,在社会生产生活等领域的应用也越来越广泛,其中基于图像的三维重建方法由于操作简单且恢复效果较好,成为近年来的热点问题。从单幅图像恢复目标区域的三维形状,由于其本身存在的不适定性,是三维重建中具有挑战性的工作之一。本文对基于单幅图像的三维重建方法进行了研究,主要研究工作如下:(1)提出了一种改
近年来,我国高度重视农业信息化发展。我国葡萄种植面积大、产量高。葡萄病虫害的发生将直接影响葡萄的产量和品质。葡萄病虫害知识以书籍文献形式存在,葡萄种植人员无法快速获取到葡萄病虫害知识。为解决以上问题,帮助葡萄种植从业者高效准确地获取到有价值的信息,本研究利用知识图谱组织葡萄病虫害领域知识,利用深度学习模型理解自然语言问句语义信息,设计实现基于知识图谱的葡萄病虫害自动问答系统。因目前我国葡萄产业知识
电子商务的蓬勃发展为用户提供便利的同时也带来了信息过载的问题。推荐系统能够为用户筛选出少量其真正感兴趣的物品,缓解信息过载的问题。为同时兼顾效果和性能两个方面,一般会将整个推荐系统分为召回和排序两个阶段。其中召回阶段使用简单模型,在线性时间内将系统中与用户相关的物品尽可能多的找回,形成召回候选集;而排序阶段则可以使用复杂模型,对召回候选集进行点击率预测和排序,提高最终推荐效果。综上所述,本研究构建
对动物的目标跟踪是研究其健康状况和行为分析的基础。为了准确实时地获取动物的个体信息和行动状况,本文以西北农林科技大学畜牧教学试验基地的奶山羊养殖场视频为研究对象,基于Target-Aware Deep Tracking(TADT)算法,并结合注意力机制和模板更新方法,对奶山羊对象进行跟踪及精度评价,验证了改进后算法的有效性。本文主要的研究内容与结论如下:(1)数据集的构建及预处理。为获取数量充足的
在计算机视觉领域,视频动作识别近年来倍受关注。视频通常具有丰富的场景类型,比如街道监控视频、室内监控视频和某种体育项目的比赛视频等,而针对特定场景下的视频动作识别会更具有实际意义。对于体育视频中的羽毛球单打视频,为了能更好地辅助教练分析视频中球员的动作,以及使用户可欣赏到每种击球动作的视频集锦等多元化需求,本文基于羽毛球视频精彩片段展开对羽毛球动作识别的研究。论文主要的研究内容和结论如下:(1)羽
精准养殖是目前畜牧业发展的主流方向。为提高奶山羊图像分割精度,促进养殖产业精准化和智能化发展,本文以羊场环境下获取的奶山羊图像为研究对象,实现了基于改进Mask R-CNN算法的奶山羊图像实例分割。本文的主要研究内容和结论有:(1)奶山羊实例分割数据集的构建。针对缺少奶山羊实例分割公开数据集的问题,通过在奶山羊养殖场安装远程高清摄像机,获取室内外奶山羊监控视频。首先对视频进行关键帧提取,人工筛选出