论文部分内容阅读
行人检测在智能交通、视频监控、多媒体检索等领域具有重要的应用价值。行人检测的相关方法与关键技术已经成为计算机视觉领域研究热点。然而,行人的多姿态、多尺度、局部遮挡等因素均会影响检测性能。近年来,基于部位模型的行人检测方法已经成为目前目标检测领域的热点,本文以此为研究内容,引入拓扑描述及建模方法。相关成果具有理论意义和应用价值。
论文提出了一种基于拓扑模型的行人检测方法,该方法将行人分为若干个部位,并对各个部位分别进行检测,保证每个待检测部位在最大响应值下输出检测结果。提出了一种行人拓扑描述子(Log-polar Topology Pattern)用以描述行人各个部位间的拓扑关系,并利用单类支持向量机(One-Class Support Vector Machine,OC-SVM))训练行人拓扑模型,对图片中的待检测样本进行二分类,实现图片与视频帧中的行人检测。
在行人部位检测的过程中,利用 HOG特征和线性 SVM分类器进行检测。在行人拓扑关系描述的过程中,考虑到部位检测过程中各部位的独立性,引入了整体拓扑描述。拓扑模型描述了有拓扑关联的部位间两两关系,同时能够描述整个行人的姿态特征。鉴于行人姿态描述的特殊性,采用 OC-SVM作为分类器对拓扑关系进行建模。OC-SVM应用于只包含一类样本的情况,在高维特征空间中构造一个尽可能多的包络正例样本且尽可能小的超球体,从而描述一类样本数据分布的二值模型。
本文提出的行人检测方法在两个公开数据集合上进行了实验验证,均取得了较好的效果,能够显著提高在多姿态、多尺度、局部遮挡等情况下的检测率。