论文部分内容阅读
头部姿态估计作为研究人类行为和注意力的关键技术,在人脸识别、人机交互、汽车安全驾驶、智能监控等领域有着广泛的应用。传统的侵入式头部姿态估计系统精度高但使用繁琐,价格昂贵。基于多目视觉的非侵入式系统原理简单,但立体匹配困难,且各相机的相对位置和光照条件需要严格约束,严重制约了其在现实生活中的应用。因此,设计一款基于单目视觉的头部姿态估计系统具有一定的学术意义和应用价值。论文选用ARM+FPGA的SoC架构作为实现平台,采用单目视觉的方式,实现了一款自然光条件下、非侵入式的头部姿态估计系统。论文主要工作:采用SoC技术完成了系统平台的搭建,同时在平台上实现了图像的采集;然后分析研究了主动表观模型(Active Appearance Model,AAM)算法定位人脸特征点和EPnP(Efficient Pespective-n-Point)算法计算位姿的原理,对算法中的不足进行了优化改进,提升了头部姿态估计的速度和精度;最后采用Qt应用程序开发框架,借助OpenCV计算机视觉库,结合改进后的算法实现了上层应用软件的开发,并将其移植到平台上完成了系统整体设计。论文主要贡献包括:(1)提出了一种以单幅数字图像解析人体头部在三维空间中姿态的算法方案,避免了多目视觉系统视场小、计算量大、对条件要求苛刻等问题。(2)针对AAM算法定位人脸特征点耗时大的问题,在预处理过程中,引进高效的Camshift跟踪算法对人脸定位,提高了更新AAM模型初始位置的效率;在拟合过程中,利用多分辨率框架,采取“由粗到细”的拟合方式,减少每次迭代时所用的纹理信息量,提高了AAM算法拟合速度。(3)针对“局外点”影响EPnP算法精度的问题,论文提出了一种根据重投影误差筛选合适2D-3D点来提高精度的改进方式,利用初次估计的头部姿态结果计算重投影误差,筛选出误差最小的5组2D-3D点再次进行头部姿态估计,在保证算法计算速度的同时提升了算法的精度。(4)采用SoC技术实现了头部姿态估计系统原型开发,扩展性强,资源丰富,有利于后期针对实际应用场景功能扩展和快速产品化。测试结果表明,系统每秒能处理8~9帧图像,偏航角、俯仰角和滚转角的平均绝对误差分别为2.64o、3.01o和1.81o,实现了利用单目视觉对人体头部姿态的估计,系统使用方便,精度较高,适应性较强,达到预期的设计目标。