论文部分内容阅读
基于车载单目摄像头的远红外行人检测具有重要的学术意义和实际应用价值,已成为目前计算机视觉领域的研究热点。与传统的面向视频监控的行人检测相比,车载远红外行人检测的主要特点在于摄像头、行人的动态性和检测的实时性。目前的车载远红外行人检测方法主要包含基于概率模板匹配的方法和基于机器学习的方法,由于基于机器学习的方法通常具有更高的检测准确性,已成为目前车载远红外行人检测的主流方法。虽然目前在机器学习框架下的各个关键环节,已有多种方法被提出,但鲁棒和实时的远红外行人检测方法仍然是一个挑战性的技术问题。这是因为:检测方法必须能够应对动态且复杂的交通场景、行人尺度和外观的巨大变化、场景温度的动态性、行人细节信息的缺失,此外,检测系统的严格实时性需求导致不能使用复杂度太高的检测方法。本文围绕车载单目远红外行人检测问题展开研究,致力于解决实时鲁棒的行人检测问题,在机器学习框架下,针对远红外行人检测的各个关键环节进行了系统的研究。主要研究内容包括远红外行人候选区域(Regions of Interest,ROIs)生成方法、远红外行人特征提取方法、远红外行人分类器设计方法以及远红外图像场景上下文信息挖掘等方面的研究。论文的主要贡献如下:1)提出一种基于路面信息与自适应阈值的远红外行人分割方法以获取ROIs。针对目前的远红外行人分割方法易于受背景热源干扰,提出了一种道路水平线估计算法以自适应地定位感兴趣的图像区域(Area of Interest,AOI),进而在AOI中执行亮度水平投影,使得行人可能存在的带状区域被快速定位,从而减少背景热源对行人分割的影响。在此基础上,针对目前的远红外行人分割方法未能很好地应对行人尺度的多样性问题,每个估计的垂直图像带状区域的宽度(指代某个行人的宽度)被视为指导执行后续分割算法的关键参数。通过与目前优秀的远红外行人分割方法进行实验对比分析,验证了该方法的优越性及抵抗噪声的有效性。2)提出两种远红外行人局部描述特征。针对目前单纯基于全局特征的远红外行人检测方法,计算开销通常较大且未能很好地应对行人与非行人的类间方差较小的问题,考虑到局部特征通常计算开销较小,并且远红外行人具有一些特定的局部模式,提出对远红外行人头部和躯干部位分别进行建模,从而提取基于头部自适应定位的亮度特征和躯干填充率特征,实现了对头部和躯干的快速分类。另外,基于所设计的局部特征,根据市区、郊区场景的成像特点,分别搭建了基于部件模型与全局模型并/串联分类的两种行人检测方法,并通过实验验证了这两种局部特征的有效性。3)提出一种编码自相似的局部强度差异直方图(Coded and Self-similarity Histogram of Local Intensity Differences,CSHLID)特征以及两种远红外行人过滤器。基于统计识别框架,为确保全局和局部之间的梯度朝向关系能分别描述远红外行人的整体模式和局部模式,提出一种CSHLID特征以描述远红外行人,从而增强了对远红外行人局部边缘模式和整体形状的描述。在此基础上,为进一步提升检测速度并抑制虚警,设计了一种融合行人头部亮度和梯度信息的行人头部过滤器和一种基于曲线拟合技术的道路障碍物检测过滤器。实验表明,CSHLID特征能有效表征远红外行人;过滤器能有效抑制系统可能出现的虚警并减少后续机器学习分类的计算开销;基于CSHLID和过滤器所构建的行人检测方法能在不同类型场景(郊区、市区)以及不同季节下均获得较好的性能。4)提出构建远红外行人概率模板的新方法并联合异质特征实现行人检测。根据远红外行人头部的成像特性,建立多尺度行人头部概率模板以缓解行人外观模式差异较大的问题。然后,基于头部自适应定位方法对模板进行融合,从而选取最优的模板进行行人匹配,使得匹配开销和准确性得以提升。进一步,对满足模板匹配的ROIs,通过融合目前优秀的远红外行人描述特征,得到异质特征,在机器学习框架下最终实现行人检测。实验表明,相对于目前单纯基于概率模板或机器学习的行人检测方法,该方法取得了更高的检测准确率。5)提出挖掘远红外交通场景中的上下文信息以实现基于场景上下文的远红外行人检测。目前多数的远红外行人检测方法只关注于行人模式本身进行分类,而交通场景下的上下文信息,对提升行人ROIs分类的准确性是有益的。通过研究交通场景下有利于辅助行人检测的场景上下文信息,提出了三个算法以挖掘远红外图像的场景上下文信息,从而在贝叶斯最大后验概率框架中,集成了上下文信息(“全局”信息)和源自于低层次特征的信息(“局部”信息),进而提出了一个使用上下文信息的远红外行人检测方法。在自行采集的数据集和公共基准数据集上进行的大量实验,验证了该方法的有效性与前景。