论文部分内容阅读
在计算机视觉领域,多目标追踪一直是研究的热点和难点。多目标追踪中,运算数据量大、算法处理速度要求高,从而使得追踪速度和准确性无法较好权衡,为此提出将单目标追踪时具有快速优势的核相关滤波应用于多目标追踪。以期在考虑追踪速度的同时,能够保证较高的追踪准确性。本文分为以下四个部分:(1)目标检测。由于2D MOT 2015、MOT16数据集目标存在误检和漏检的情况,为此提出使用更快的区域卷积神经目标检测网络(Faster Region-based Convolutional Neural Networks,Faster R-CNN)进行检测,将网络检测得到的结果取代数据集提供的检测结果。(2)目标追踪。为了在多目标追踪中加入目标外观信息,并且综合速度与精度因素,本文采用核相关滤波模型。但是,通过实验发现在进行多目标追踪时,追踪结果并不理想,这是因为核相关滤波算法不支持多尺度。为了克服该问题,本文通过计算检测目标框和预测目标框的交并比方式进行解决,对于符合要求的目标使用检测目标框代替核相关滤波预测框。(3)追踪结果关联。对于第(2)部分的交并比计算,实际是一批检测框与一批预测框的匹配关联,本质是任务分配的最优解问题,本文采用匈牙利算法确定目标间的最优关联。(4)目标重现判断。在目标追踪的过程中会出现目标短暂消失又复现的情况,为了提高模型对此类问题的处理能力,提出使用目标相似性判断方法对出现的“新目标”进行相似性判断,如果相似性小于特定范围就判定为同一个目标。由于核相关滤波和交并比模型都具有快速响应的特点,因此算法可满足在线处理数据的要求。此外,核相关滤波属于位置搜索判定目标的模型、交并比属于重叠区域计算模型,二者结合能够有效解决目标非惯性运动和相机抖动等情况。在公开的2D MOT 2015、MOT16数据集上进行实验:对于目标检测部分,通过实验表明采用Faster R-CNN网络的检测结果能够比原数据集提供的精度高出6%;对于多目标追踪部分,将本方法与其他主流方法相比,在保证具有30 frame/s以上的处理速度的同时追踪准确性依然高出10%以上。为了进一步促进核相关滤波在多目标追踪领域的发展,现将本文源代码开源,获取链接为:https://github.com/HappyUncle/KCF_IOU_Tracker。