基于卷积层推理的相关滤波目标跟踪算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:zyjzyj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪来源于人类生活中常见的注视行为,它是计算机视觉中最基础且重要的任务之一,被广泛应用在军事、安防、人机交互、医学临床诊断等领域。当前研究比较火热的目标跟踪算法主要为相关滤波跟踪算法与深度学习跟踪算法在相关滤波目标跟踪算法中,CSK相关滤波目标跟踪算法利用正则化最小二乘法计算滤波器模板,使用循环位移操作扩展训练集,通过在循环位移的训练图像中定义核空间的方式引入非线性核,由于具有高速、准确的优点,成为了目标跟踪领域中的一个经典模型。然而CSK跟踪算法作为一种相关滤波算法存在着跟踪区域与模板尺寸的耦合,这个耦合导致了CSK跟踪算法只能对跟踪图像的小局部进行跟踪。而在实际场景中,由于物体的快速移动、视频掉帧或者准确率不佳等因素,目标会偏移到跟踪区域之外,这就会导致CSK跟踪器跟踪的完全失败。针对CSK跟踪器这个缺点,本文提出了一种改进的CSK目标跟踪算法。算法利用深度学习中的卷积层推理方法,对跟踪区域与模板尺寸进行了解耦,得到了一种可以自由选择跟踪区域的改进CSK跟踪算法,并设计了三种模板计算方法(CSK模板裁剪、交替方向乘子法、梯度下降法),在OTB100数据集上,改进的CSK跟踪算法在同样的配置下比原CSK跟踪算法精确度高10.8%,验证了算法的有效性。此外,为了加速卷积层推理过程,本文还提出了一种基于快速傅里叶变换的高效卷积层推理算法,算法将卷积层推理过程转化到频域,通过解决频域乘法的循环问题,大幅提高了大卷积情况下的卷积层推理速度,在卷积核大小为50的情况下,快速傅里叶变换卷积层推理算法速度比普通卷积层推理算法快100倍以上。
其他文献
数字多媒体广播(Digital Multimedia Broadcasting,DMB)具有覆盖范围广、效率高的优势,可以同时向大批量终端发布信息等特点,能够与通信网络形成有效互补。但是由于DMB的带宽
目的:研究鉴定分枝杆菌细胞壁脂质PDIM诱导Gal-3表达的TLR信号通路,明确Gal-3对PDIM调控炎症介质释放的影响及其机制;并进一步研究Gal-3对PDIM介导肉芽肿形成的意义与机制。方法:将Raw264.7细胞分为正常对照组(Mock)、WT野生株和PDIM缺失突变株(命名为△PDIM)感染组。(1)Western blot检测各感染组0.5-4 h内Gal-3蛋白表达,qRT-PCR检
随着人工智能技术的飞速发展,汽车产业的技术革命迫在眉睫。近年来,无人驾驶汽车,作为两者的结合,逐渐受到越来越多学者以及产业界的关注。导航算法作为自动驾驶的核心组成,
相比传统人脸检测方法,运用深度学习理念的人脸检测算法在检测精确度上有很大优势,它拥有深层次的主干网络,能够提取到图像中更抽象的特征值,模型结构更加复杂,候选框等参数
在磁惯性聚变的套筒压缩磁化等离子体内爆过程中,真空和套筒界面、套筒和燃料界面由于MRT不稳定性导致扰动剧烈发展,影响聚变等离子体品质。MRT发展程度及其调控是影响磁惯性
随着智能制造时代的到来,机器人技术的发展受到了人们的广泛关注。智能移动机器人可应用于工业和服务业,节约大量的经济与人力成本以及丰富人们的生活。在智能移动机器人执行
随着大数据时代的到来,政府数据开放运动在全球范围内开展起来,各国政府将开放政府数据上升到国家战略的高度,这说明各国政府已经认识到开放政府数据的重要性。我国政府也不例外,近年来,政府部门积极开展政府数据开放工作,挖掘政府数据的潜在价值,充分意识到政府数据开放的重要意义。本文通过文献调查法对国内外政府数据开放相关研究进行整理分析发现,目前国内学者对于政府数据开放与公众服务等方面研究较少,而开放政府数据
为了更好地胜任不同行业的口译工作,口译员不仅需要掌握必要的语言知识,还应当广泛涉猎,增加言外知识储备。国内外学者的研究表明,言外知识对口译的各个环节都有着重要的影响,与口译成效正相关。本文首先从前人的相关研究切入,对言外知识进行界定并概括其对口译的普遍影响;之后以笔者参与的第二届“一带一路”国际合作高峰论坛普京记者会俄汉交传模拟会议为探讨案例,分析口译过程中言外知识带来的积极影响及言外知识不足引起
实验作为加深学生对理论知识的理解,培养学生动手实践能力的重要手段,近年来正在得到各大高校的重视。远程虚拟实验是一种高效灵活的实验方式,不仅解决了传统实验模式存在的
近年来,多标签学习在文本分类、图像识别以及生物信息学等多个领域受到广泛关注。目前多标签学习关注的主要问题包括标签关联性以及标签复杂度,而分类器链方法是一种兼顾标签