论文部分内容阅读
本论文提出了一种基于Rough集理论改进的HOG特征行人检测方法,目的是提高检测精度的同时加快行人检测的速度。原HOG特征是在64*128像素的检测窗口中提取105个Block,每个Block由2*2个cell组成,每个cell为9个通道(bin)的直方图,那么原HOG特征就是一个3780维(105*4*9=3780D)的特征向量。这一特征已经可以对行人检测作出较为正确地判断,但需要计算的Block数量过多,维度过大,导致特征计算和分类器预测时间过长,不利于一些高实时性的检测要求。本文通过利用Rough集的相关理论来对HOG特征中的Block进行筛选,并按照Block的分类能力,对其进行重要度排序,越重要的Block代表着越强的分类能力,对分类所起的作用越大。为了提高检测精度,本论文还对HOG特征进行了扩展,从原HOG特征105个Block增加到236个,并对这236个Block建立重要度排序。并以此建立一个级联的分类器,按照Block的重要度顺序,每层分类器以逐层增加Block的方式训练得到,分类器采用线性SVM。经过筛选并训练,最终的特征向量只有108到1800维之间。本文的级联的每层分类器不仅用来进行负判断,还通过设置正阂值来进行正判断,而通常的拒绝式级联分类器每层只用来排除负样本。在实现上述方法的过程中,本文还利用了基于信息熵的离散化方法来对特征维进行离散化,并提出了两种利用Rough集相关理论来评价属性重要度的方法,一种是利用条件属性区分决策属性产生的边界域的大小,边界域越小,重要度越高;另一种是利用改进的区分矩阵的方法来评价属性的重要度,在改进的区分矩阵中,出现次数越多的属性越重要。本文的行人检测过程采用滑动窗口的模式,对滑动窗口检测后的重叠窗口合并问题,总结了三种方法。同时为了加速在视频流中的行人检测,还采用了背景擦除的方式来进行预处理。本文最后还设计制作了一个行人检测系统,对行人检测部分实现细节做了探讨,并对检测结果做了分析。实验结果证实,本文的方法在检测速度上得到了大幅度的提高,并且在检测精度上也有一定的提升。