【摘 要】
:
目标跟踪作为计算机视觉领域的重要分支,已经广泛应用于智能视频监控、自动驾驶、军事侦察、医学诊断等领域。传统的目标跟踪算法在面对目标快速移动、模糊、物体形变、光照变化等复杂场景的时候,有着很大局限性。随着深度学习的发展,一系列基于深度学习的目标跟踪算法逐渐被提出,这些算法凭借着卷积神经网络强大的特征提取能力,极大地提高了目标跟踪的精度,在面对复杂场景时也有着更好的鲁棒性。但是基于深度学习的跟踪算法网
论文部分内容阅读
目标跟踪作为计算机视觉领域的重要分支,已经广泛应用于智能视频监控、自动驾驶、军事侦察、医学诊断等领域。传统的目标跟踪算法在面对目标快速移动、模糊、物体形变、光照变化等复杂场景的时候,有着很大局限性。随着深度学习的发展,一系列基于深度学习的目标跟踪算法逐渐被提出,这些算法凭借着卷积神经网络强大的特征提取能力,极大地提高了目标跟踪的精度,在面对复杂场景时也有着更好的鲁棒性。但是基于深度学习的跟踪算法网络层数多,参数量大,使得模型的训练和更新速度较慢。对此,本文设计了一种低参数的基于深度学习的目标跟踪算法,在保证跟踪精度的同时,大大地降低了模型的大小。针对深度学习跟踪算法参数量多、模型大的问题,本文提出了一种基于非对称卷积模块的网络结构模型。非对称卷积模块包括两个卷积层,分别为压缩层和非对称层,其中压缩层用来减小卷积核之间的通道数,降低模型的参数量,非对称层对特征进行重新融合,用来减少模型的精度损失。为了提高模型的跟踪精度,本文设计了一种新的三元组损失函数来对模型进行训练,与原来的逻辑损失函数相比,三元组损失函数能够充分地利用输入之间的潜在关系,使网络模型获得更高的跟踪精度。最后本文结合非对称卷积和三元组损失函数,提出了一种低参数的基于深度学习的实时目标跟踪算法。实验结果表明,本文算法通过使用非对称卷积模块,模型大小由原来的9.8M降低到了3.8M,使用三元组损失函数进行训练时,模型的精度也有所提升。并且与一些经典算法相比,本文算法也有着更好的跟踪精度,同时本文算法还有着较好的实时性,在GOT-10K数据集上的跟踪速度达到了97FPS,能够实现实时跟踪。
其他文献
随着交通运输行业的飞速发展,交通工具运行速度稳步提升,与空气的相互作用不断加剧,流固耦合问题日益严重,运动部件的气动特性与动力装置的能源利用效率成为交通运输行业亟待解决的关键问题。与此同时,随着空气动力学研究的深入,边界层理论在解决气动特性问题上受到了广泛关注,并为流动控制技术提供了丰富的理论支撑。作为基于等离子体气动激励的一种新型主动流动控制技术,沿面型介质阻挡放电(Surface Dielec
脉冲神经膜系统(SNP)是一种受生物神经元以脉冲的方式传递信息的机制启发设计的神经计算模型,属于第三代人工神经网络。SNP应用潜力巨大,研究SNP的学习算法可以构建一个机制更加符合人脑模型的学习框架,但是将其应用在模式识别领域一直是一个未被完全解决的公开问题。本文以数值型脉冲神经网络为出发点,结合SNN中的成熟的学习算法、网络结构,以及马尔可夫决策过程的思想和强化学习方法,设计了两类数值型SNP学
云南电网与南方电网主网异步联网后,外送直流容量远远大于本地负荷水平,水轮机组占总装机70%以上,部分电网发电机组惯性降低,直流闭锁故障往往产生系统有功功率的不平衡,极易发生超低频振荡,云南电网中功角稳定问题转换为频率稳定问题。为了提高主网对云南电网频率稳定性的辅助调节作用,实际工程建设中在直流送端系统中加入频率限制控制器(FLC,Frequency Limit Control)与一次调频协调作用,
图像分割是一种关键的计算机视觉技术,其将图像的像素分为不同的具有区别性事务的块。多层次图像分割是图像分割方法的一种,可捕获目标的所有尺度,故被广泛运用到语义分割和区域建议生成等计算机视觉场景。多层次图像分割的结果可表示成树形结构,图像中目标根据分割粒度不同,分布在树中不同层次。尺度感知是从目标的多个分割尺度中捕获其合理分割尺度,是多层次图像分割方法实现图像分割的关键。本文基于已有多层次图像分割方法
20世纪20、30年代的摩登上海,是中西文化的交流场域,书籍设计作为一种文化载体不仅反映了时代的审美,更是成为那个时代的文化表征。文化的大熔炉也为中国现代书籍设计提供源源不断的创作资源,而叶灵凤作为那个文化场域的跨文化译介者,在受到从清末到民初繁杂的文艺思潮影响后,所做的书籍设计也成为了那个时代的表征。就将西方元素本土化的这一创造性过程,叶灵凤承担了一位审美现代性与启蒙现代性的推者,其创造性不仅在
网络是一种有用的模型工具,许多现实中的复杂系统都可以借助网络模型来进一步研究。社区是网络中一种重要的结构性质,它是由网络中联系紧密的节点构成的集合。同一个社区内的节点具有某种共性,因此社区体现了网络的局部特性,能够帮助人们挖掘和分析网络中所蕴含的知识。社区发现是检测网络中社区的主要方法,然而网络往往规模庞大且结构复杂,社区间的分界线不明显等为社区发现带来了巨大挑战。为了解决这些问题,本论文从重叠和
轻型载货汽车在城市道路的公路运输中扮演着重要角色,而与此同时,消费者对载货汽车的品质有越来越高的要求,消费者越来越关注汽车行驶的平顺性与舒适性,使得车辆的振动性能成
乳腺癌是全世界范围内威胁女性健康最主要的癌症之一,而超声(US)是乳腺结节的主要影像学检查和术前评估之一。然而,在超声诊断领域,由于良性和恶性乳腺结节图像的相似表现形式,这使得诊断结果在很大程度上依赖于医生的经验判断。而且具有不同资历的医师的诊断准确性相差高达30%,因此,很容易导致误诊并增加不必要的穿刺活检率。近年来随着计算机科学的不断进步和医学方面的数据集的不断丰富,计算机辅助的医学诊断逐渐成
随着信息时代的不断进步以及电子产品的全民化普及,网络上代表着用户情感和观点的短文本内容呈现爆炸式的增长,传统的基于深度学习的中文情感倾向分类方法无法完全挖掘出这些评论的商用价值。为此,本文研究了中文评论短文本的情感倾向以及与互动率的关系,并设计实现了一个评论情感倾向与互动率预测系统。本文针对电影新闻相关的在线短文本评论数据,首先提出了一个基于LSTM的前融合情感倾向分类模型PF-LSTM,实现了不