论文部分内容阅读
对三维环境的实时感知与识别是机器人研究领域的关键技术。而对行人的检测与三维位置感知技术,可以帮助机器人更好、更安全的服务人类,具有很大的研究价值。相比其它深度传感器,双目视觉系统具有价格低、体积小、功耗低等优势,适合移动机器人的应用场景。但基于双目视觉系统的行人检测算法计算量巨大,难以满足移动机器人对实时性的要求。针对移动机器人对于行人三维位置感知与检测的实际需求,本文搭建了一个基于Xilinx Zynq-7000平台的双目行人检测系统。对行人的三维位置感知与检测技术主要包括:三维环境信息获取与行人检测两部分。相应地,本文主要研究了双目视差计算与行人检测算法在FPGA上的实现。双目视差计算模块通过立体匹配算法获取环境的视差信息,可以给行人检测模块带来很大的帮助。其中匹配信息可用于验证行人检测结果,提高检测正确率。视差信息可以实现缩小行人搜索区域、环境多目标分割、行人三维定位等功能,这对于构建功能更为强大的行人检测系统具有重要意义。双目视差计算模块包括:视频同步采集、双目立体校正、Census特征向量提取、SGM算法和视差优化等子模块组成。针对立体匹配算法在搜索时存在计算量大的问题,本文对双目视觉系统进行了立体校正处理,从而将搜索区域从二维降到一维。由于8方向路径聚合算法存在数据流与计算流方向相反的问题,本文选用了3方向路径聚合算法。针对3方向路径聚合后的视差图,存在条纹与误匹配现象。本文使用左右一致性检验与中值滤波算法对视差进行了优化。行人检测模块选用了方向梯度直方图作为行人特征,采用线性支持向量机对行人进行二分类。其中分类所需的特征向量是通过FPGA实时提取出来的,所需的分类系数与分类阈值是在PC端使用libsvm工具箱训练得到的。针对方向梯度直方图向量归一化流程过长的问题,本文将SVM分类器内嵌到了特征向量计算模块。试验表明,本文搭建的基于双目视觉的行人检测系统性能良好。在保持较高精度的同时,能够满足移动机器人等场景对于实时性的要求。其中双目视差计算模块在帧率为60 fps的系统中能正常工作,行人检测模块最大速率可达到314 fps。本文在FPGA实现的双目视差计算算法与行人检测算法可作为视觉加速模块,对于高速移动机器人环境感知功能的产品化有一定帮助。