论文部分内容阅读
目标检测与跟踪是智能检测与监控中的关键研究问题和研究热点。近年来,机器学习、神经网络、深度学习等各种新的数学工具的不断涌现,使得目标检测与跟踪技术得到进一步的发展。本文针对目标检测在实际应用中由于参数设置导致算法面临的准确性、实时性以及鲁棒性的问题:例如目标位置与相关动态参数的检测无法同时获得导致的实时性问题;从参数估计的角度探讨了传统背景减除法关键参数无法自适应导致算法的准确性与鲁棒性问题。本文的主要成果第1,2和3部分就此展开了一些研究与讨论。针对复杂背景下多目标之间由于遮挡导致跟踪轨迹不连续的问题,本文的研究成果的第4,5部分做了一些研究和探讨。其主要工作内容与成果如下:
1.针对目标的定位与位置相关的参数不能一次性得到检测结果的问题,提出一种基于特征维度和角度回归的深度学习算法。算法基于SSD(Single Shot Detector)单次检测器。与传统SSD不同的是,算法采用可旋转的边框,只需要一个前向神经网络即可得到目标的类别、定位以及角度等多个检测结果。算法使用的可旋转边框比传统垂直边框具有更好的鲁棒性,其抗干扰能力也更强。算法采用一种基于语义聚类的模块,既提供了位置信息也提供了语义信息,有助于提高分类与定位的准确度。采用一种基于特征维度的模型作为学习框架预测层的输入。模型能够自适应选择有意义的特征并忽略那些无意义的特征。算法使用不同尺寸、长宽比、多角度的定锚,这种锚既顾及到了计算速度也兼顾了精确度。在已有的边框回归中嵌入了角度回归,可以得到目标位置的得分值的同时获取角度检测结果。因此,无需增加额外预测角度的开销。以SAR图像中船只的检测与角度预测为例,算法使用一个前向神经网络即可获取船只的位置和角度信息。实验结果表明该算法在提高了船只检测的有效性的同时能够得到船只角度预测结果。
2.针对智能监控中视频流参数发生调整时(例如视频分辨率),传统算法无法自适应获取诸如搜索半径等关键参数,从而引起的鲁棒性问题。提出一种基于QPSO(Quantum-behavior Particle Swarm Optimalization)的VIBE(Visual Background Extractor)改进算法。基于QPSO具有良好的全局搜优能力,算法先利用QPSO对于当前视频流的搜索半径进行搜优,然后利用基于非参数概率密度的背景建模算法VIBE进行目标检测。实验定量结果和定性结果都说明了在视频流分辨率发生变化情况下,比传统VIBE算法在正确分类百分比等检验参数上具有较为明显的改善。
3.针对智能监控中运动目标如果出现在初始帧中,则会在检测到的前景中出现鬼影的问题。提出了一种识别鬼影的算法。该算法利用计算当前帧灰度图像与当前二值图的轮廓重叠像素点个数从而使用阈值法的方式分辨出鬼影和静止目标,进而使用不同方法对其实行抑制的改进方法。实验结果验证了算法的有效性,说明了在鬼影的抑制能力上优于传统的VIBE算法。
4.针对多目标跟踪中目标之间相互遮挡,造成跟踪轨迹不平滑的问题。提出一种基于嵌入式空间的多目标跟踪算法。算法建立一个遮挡关系函数,定量表示发生遮挡目标之间的关系,并将之合并到跟踪算法框架内。同时,对联合状态预测函数进行分步处理,使得多目标的跟踪问题变成在嵌入空间中的分类问题。实验表明本文的算法能在有遮挡情景下有效实施目标跟踪。
5.针对复杂环境下大量外形类似目标跟踪容易丢失,从而造成跟踪轨迹不连续的问题。提出了一种基于条件随机场多运动目标跟踪算法。与以前针对所有目标的外形特征不同,算法对跟踪子对进行标示。采用分层结构,由低阶状态作为输入序列到高阶,通过代价函数最小化,从而得到最终连续跟踪轨迹。能有效解决复杂环境下多目标不连续的问题。算法对于外形类似的被跟踪目标以及相互遮挡严重的情况有比较明显的优势,相比当前流行的算法,例如OLDAMS和PRIMPT等,实验结果表明本文算法对于复杂环境下多目标跟踪的效果更佳。
1.针对目标的定位与位置相关的参数不能一次性得到检测结果的问题,提出一种基于特征维度和角度回归的深度学习算法。算法基于SSD(Single Shot Detector)单次检测器。与传统SSD不同的是,算法采用可旋转的边框,只需要一个前向神经网络即可得到目标的类别、定位以及角度等多个检测结果。算法使用的可旋转边框比传统垂直边框具有更好的鲁棒性,其抗干扰能力也更强。算法采用一种基于语义聚类的模块,既提供了位置信息也提供了语义信息,有助于提高分类与定位的准确度。采用一种基于特征维度的模型作为学习框架预测层的输入。模型能够自适应选择有意义的特征并忽略那些无意义的特征。算法使用不同尺寸、长宽比、多角度的定锚,这种锚既顾及到了计算速度也兼顾了精确度。在已有的边框回归中嵌入了角度回归,可以得到目标位置的得分值的同时获取角度检测结果。因此,无需增加额外预测角度的开销。以SAR图像中船只的检测与角度预测为例,算法使用一个前向神经网络即可获取船只的位置和角度信息。实验结果表明该算法在提高了船只检测的有效性的同时能够得到船只角度预测结果。
2.针对智能监控中视频流参数发生调整时(例如视频分辨率),传统算法无法自适应获取诸如搜索半径等关键参数,从而引起的鲁棒性问题。提出一种基于QPSO(Quantum-behavior Particle Swarm Optimalization)的VIBE(Visual Background Extractor)改进算法。基于QPSO具有良好的全局搜优能力,算法先利用QPSO对于当前视频流的搜索半径进行搜优,然后利用基于非参数概率密度的背景建模算法VIBE进行目标检测。实验定量结果和定性结果都说明了在视频流分辨率发生变化情况下,比传统VIBE算法在正确分类百分比等检验参数上具有较为明显的改善。
3.针对智能监控中运动目标如果出现在初始帧中,则会在检测到的前景中出现鬼影的问题。提出了一种识别鬼影的算法。该算法利用计算当前帧灰度图像与当前二值图的轮廓重叠像素点个数从而使用阈值法的方式分辨出鬼影和静止目标,进而使用不同方法对其实行抑制的改进方法。实验结果验证了算法的有效性,说明了在鬼影的抑制能力上优于传统的VIBE算法。
4.针对多目标跟踪中目标之间相互遮挡,造成跟踪轨迹不平滑的问题。提出一种基于嵌入式空间的多目标跟踪算法。算法建立一个遮挡关系函数,定量表示发生遮挡目标之间的关系,并将之合并到跟踪算法框架内。同时,对联合状态预测函数进行分步处理,使得多目标的跟踪问题变成在嵌入空间中的分类问题。实验表明本文的算法能在有遮挡情景下有效实施目标跟踪。
5.针对复杂环境下大量外形类似目标跟踪容易丢失,从而造成跟踪轨迹不连续的问题。提出了一种基于条件随机场多运动目标跟踪算法。与以前针对所有目标的外形特征不同,算法对跟踪子对进行标示。采用分层结构,由低阶状态作为输入序列到高阶,通过代价函数最小化,从而得到最终连续跟踪轨迹。能有效解决复杂环境下多目标不连续的问题。算法对于外形类似的被跟踪目标以及相互遮挡严重的情况有比较明显的优势,相比当前流行的算法,例如OLDAMS和PRIMPT等,实验结果表明本文算法对于复杂环境下多目标跟踪的效果更佳。