基于深度卷积神经网络的目标跟踪

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zkhjpaul
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线单目标跟踪是人工智能和计算视觉领域中很重要的子课题,广泛应用于视频目标检测和监控、医学图像理解分析、智能人机交互等领域。通常情况下,在视频序列的第一帧给定准确的目标框,随后帧中自适应地跟踪该目标。在跟踪过程中,视频序列存在着目标遮挡、背景杂乱、目标尺度剧烈变化等挑战,关于如何克服这些挑战学者们提出过很多优秀的算法。我们在本文通过深度卷积神经网络提取跟踪目标的语义特征,进而提出了鲁棒的跟踪算法。深度神经网络在图像分类、物体检测和图像分割上取得了成功,我们发现简单地堆叠层结构并不能带来更好的结果,这样会导致梯度弥散。残差网络通过恒等映射大幅提升了网络层数,并且解决了梯度后向传播困难这一难题。文中分析了网络模型深度、优化方法和模型结构对网络泛化能力的影响,提出了随机网络深度机制来跳过残差层连接,这样升级网络结构不仅节省了训练时间并且获得了更好的效果。同时我们使用了SparkNet平台实现特征的并行计算,通过不同计算节点实现大规模的图像分类和图像检索的任务。我们分析不同深度的网络层、优化方式对模型的影响,提出了对偶网络自适应跟踪物体。在深度神经网络中,我们利用网络不同层描绘不同信息的先验来学习目标的外观信息,网络训练和更新上采用新颖的数据增广和自监督的学习方式,实现了双层对偶深度模型来跟踪目标。网络高层特征描绘物体的语义信息,低层描绘空间结构信息。为了更好地突出物体轮廓和形状,我们将分层的特征图与拉普拉斯高斯边缘检测子结合,并利用独立子成分分析来描绘物体形状。对偶网络在训练时采用中心偏移的随机块用于增广训练数据,更新时基于跟踪目标在连续帧之间有更多的相似性。在线跟踪将深度特征融入运动模型和外观模型上,随机和周期的更新机制用于解决目标偏移和遮挡问题。跟踪算法的实验是在大规模公开的数据集上进行评测,并参加了针对该任务的竞赛。在网络模型上比较不同的层连接和优化方法对结果的影响,在目标跟踪上采用了大规模具有挑战性的视频序列对本文算法进行定性和定量的评估,与大量当前的优秀算法进行对比,我们的方法取得了满意的效果。
其他文献
光学三维运动捕捉系统在动画、医疗、机器人、游戏开发等领域应用非常广泛。为了提高光学三维动作捕捉系统测量结果的动态特性,设计了高帧空间坐标测量系统和一种与图像传输
在未来的移动通信5G中,高频段频率资源的使用降低了蜂窝的覆盖范围,基站需求数量大幅度增加,同时5G中迅速增加的基站数据吞吐量对传统的基于数字基带传输的RAN带来了巨大压力,寻
在我们生活的环境中,到处可以发现噪声,这些噪声或强或弱,时时刻刻影响我们的生活。其中就语音通信来讲,语音增强技术是近年来研究的热点之一。被噪声污染的语音信号改变了最初的
随着网络时代的到来和信息技术的快速发展,信息安全越来越受到人们的关注,而获得信息的方式越来越趋向于图像和流媒体,使得图像加密成为人们研究的热点,本文研究了基于混沌理
视频复原是指从获得的退化视频去复原原始清晰视频图像的过程。它能够提取视频中感兴趣区域的清晰细节信息,降低外界噪声和拍摄操作不当造成的影响。在军事、交通、社会管理方
在当今信息技术迅速发展的同时,也出现了各种各样的危害,网络安全变得十分严峻。尤其在电子商务以及金融系统领域中,密码技术的优势更受到人们的关注。网络中参与者之间建立
随着图像、视频等数字媒体内容的迅速发展,人们对图像和视频质量的要求越来越高。面对日益增长的社会需求,迫切需要一种能够提高图像或视频质量的方法和技术。超分辨率重建是近
虚拟战场仿真是目前国内军事领域研究的重要技术之一,计算机生成兵力(Computer Generated Forces, CGF)航迹规划及碰撞检测是其核心内容,如何在虚拟战场环境中,自动、快速、准确地
随着城市高层建筑群和各类干扰源的增多,无线移动信号的传输质量也受到了不利影响。构建陆地DMB(Digital Multimedia Broadcast)基带系统模型和开展高性能纠错编码的研究已成