论文部分内容阅读
行人检测是当前计算机视觉和人工智能领域研究的重点和热点,也是目标检测的重要分支,其在军事领域、智能交通、机器人导航、智能监控、人体运动分析等领域都有广泛的应用前景。由于人体的衣着、姿势、光照各异,行人检测是非常具有挑战性的课题。目前,计算机视觉领域的主流思想将行人检测问题认为是一个模式分类问题,其方法是从大量的行人训练样本中提取特征,利用机器学习方法将行人与其他运动目标以及干扰背景区分开来,并准确定位。全景视觉系统具有视场范围大的特点,当前已经广泛地应用在机器人导航、空间探测、视频监控、虚拟现实、环境感知技术等领域。行人检测技术和全景视觉系统的结合更能充分发挥各自的优势,提供更加广泛的应用前景。在全景视觉中研究行人检测,可以充分利用全景视觉视野范围大的特点,检测到360°视野范围内的行人,更好的满足机器人导航和智能监控等应用场合的需求。近几年来,GPU和基于GPU的通用计算得到了迅速的发展,基于GPU的通用计算在计算机视觉领域得到广泛的应用。本文主要研究基于双曲面折反射全景视觉系统的行人检测方法,采用积分梯度方向直方图特征和线性支持向量机设计了基于全景视觉的行人检测器,并在GPU平台上利用并行计算技术改进了行人检测算法的关键步骤,在保持检测准确率的前提下,获得明显的检测速度上的提升。首先研究了双曲面折反射全景视觉的成像机理,推导了双曲面折反射成像系统的数学模型。为了克服全景图像畸变对行人检测的影响,对原始全景图像进行还原解算,从而获得符合正常人的视觉感受的全景图像,保证全景视觉中行人检测的准确性。然后本文设计了一个基于全景视觉的行人检测器,采用Dalal提出的梯度方向直方图特征为基础,应用了用积分图像方法来计算HOG特征集的方法,大大提高了HOG特征的计算速度,同时采用线性支持向量机作为行人分类器,对在行人检测中存在大量的重叠结果窗口,采用非极大值抑制算法进行多结果融合,获得较好的检测效果。最后本文在GPU平台上对基于全景视觉的行人检测器进行了改进,采用CUDA并行计算技术加速全景图像还原解算,积分梯度方向直方图计算和线性支持向量机检测。本文对算法的关键步骤所需时间以及资源占用情况进行了详细的分析。实验结果表明,该方法在保持行人检测准确性的同时,极大地提升了在全景图像中行人检测的速度,我们的算法所需时间只是在CPU上实现的算法的1/8左右。