论文部分内容阅读
随着国民经济的不断发展,人民生活水平的日益提高,汽车已经成为人们出行的重要交通工具;我国个人汽车的持有量在不断增加,大大提高了人们出行的便捷性,但随之而来的是交通事故的逐年增加。行人检测作为驾驶辅助系统的重要的组成部分,对保证驾驶员的安全性、保证行人的生命财产安全具有重要意义。而精度足够的行人检测系统需要大量的计算,非常耗时,难以达到实时的效果。GPU的出现与推广,为我们研究算法的并行加速提供了新的途径,计算统一设备架构(CUDA,Compute Unified Device Architecture)开启 了使用 GPU 强大计算能力做通用计算的大门,使得开发者能够在友好的开发环境中充分挖掘GPU的计算能力。而美国NVIDIA公司新推出的Jetson Pro汽车开发平台拥有强劲的性能,它可以提供一个全功能的NVIDIA CUDA平台,可以让开发者能够轻松打造和测试各种汽车与计算机视觉应用。本文主要研究的内容就是针对行人检测算法精确性和实时性的矛盾,如何将行人检测算法进行并行化改造,利用GPU进行加速来解决这一矛盾,并在Jetson Pro上进行并行算法的实验。本文通过分析研究行人检测算法的研究现状,选择Haar-like特征作为行人描述特征,采用AdaBoost级联分类器进行分类,并通过光流计算,在检测出结果的基础之上,对未来行人位置进行预测,提高行人检测算法鲁棒性。详细介绍了 CUDA的编程模型和其软硬件架构以及NVIDIA Jetson Pro汽车开发平台的性能和特点,在此蕋础上实现算法的并行化。本文通过对行人检测算法进行深刻研究,对串行算法进行耗时分析和特性分析,根据计算复杂度、数据依赖程度等方面因素,选择对算法中积分图计算、AdaBoost级联分类器、基于金字塔光流计算部分进行并行实现。并且结合CUDA的特点,提出一些优化策略,使算法更好的适用于CUDA架构,达到更好的执行效率。本文在NVIDIA Jetson Pro汽车开发平台上进行实验,对串行算法与并行算法进行耗时对比。实验结果表明,本文并行行人检测算法对比串行行人检测算法加速明显,提高了实时性。