论文部分内容阅读
目标检测与跟踪算法是计算机视觉的一个重要研究课题,并在计算机视觉领域得到了广泛关注。近年来,目标检测与跟踪算法取得了很大的进展。基于检测的跟踪算法、基于学习的跟踪算法、基于检测和学习的跟踪算法被相继提出。而TrackingLearning-Detection(TLD)长时间跟踪算法由于其在目标遮挡、消失等方面具有良好的跟踪效果而被广泛关注。TLD长时间跟踪算法被明确地分为学习、检测和跟踪三部分。尽管该算法在目标遮挡、消失等方面有较好的鲁棒性但依然存在一些不足,例如在跟踪精准度、跟踪实时性、跟踪目标初始化等方面。本文以提高TLD算法的跟踪性能为出发点,以单目标跟踪为研究对象,对TLD跟踪算法进行了研究和改进。为了解决TLD框架下的运动目标自动初始化问题,本文研究和分析了运动目标检测算法并针对基于显著图的目标检测算法进行了研究。由于视频中的运动目标可以看作是显著信息或者显著信息的一部分,因此文章提出了一种基于显著图和三帧差法的运动目标检测算法。该算法仅利用视频中运动目标出现后的前三帧来获取目标位置。算法首先使用SLIC算法将输入图像划分成N个超像素,然后利用这N个超像素来计算基于颜色对比的显著图。为了更好的定位出运动目标,文章将三帧差法生成的差分图和基于颜色对比的显著图进行了融合。为了使该算法适用于摄像机运动的情况,在检测开始前利用RANSAC算法对输入图像进行运动补偿。实验结果表明所提出的算法能够在运动目标出现后的前三帧内较好地检测出运动目标。为了解决TLD算法在目标旋转情况下易跟丢、检测时间较长等问题,本文对原TLD算法进行了改进。文章使用前一帧中的目标位移来缩小检测范围、实现检测范围的动态调整,并在此基础上提出了一种融合Median Flow算法的Knn匹配算法。该算法首先在匹配前使用上一帧得到的跟踪框来缩小匹配范围,然后使用基于ORB特征点的Knn匹配算法来定位目标在下一帧中的位置。为了提高跟踪的精确度,算法在匹配点个数偏少或匹配点集中在目标某一范围时,将通过Median Flow算法得到的跟踪点加入匹配结果以抑制匹配过程中出现的漂移。实验结果表明该算法不仅能够较好地提高TLD算法的跟踪精度还能在一定程度上减少TLD算法的检测时间。由于TLD算法本身的复杂性,该算法还不能满足实际应用中的实时性要求,因此如何进一步提高该算法的实时性仍是未来工作中需要解决的问题。