论文部分内容阅读
计算机视觉为高级的人机交互服务。它的研究内容是通过相应的理论算法使计算机能够达到、甚至超过人类的视觉感知和认知水准,最终提升人类的生产水平。目标检测、人体姿态估计和人脸识别是计算机视觉领域的核心问题。目前,目标检测已经广泛地应用于智能监控、安全检测等领域;人体姿态估计在虚拟现实、体感交互、体育分析、医疗辅助等领域倍受青睐;人脸识别是安全门禁系统、身份识别、目标追踪的重要依托手段。本文围绕这一主题展开了研究和讨论,不仅包含特征信息的提取和分类、模型描述等基础问题,同时涉及面向高级语义的图像理解,如人体运动姿态识别、人脸姿态识别等。近些年来,学术界和工业界在这些研究点投入大量的研究工作,取得了许多成果,拥有广阔的应用前景。本文从计算机视觉理论联系实际的纵向角度出发,在阅读大量相关文献的基础上,研究了包括基于特征提取和分类的目标检测算法、单目相机下人体三维姿态估计和跟踪算法、人体面部检测定位及其加速优化算法。针对现有研究的不足,本文采用了一些新颖的思想和方法进行了改进和补充,具体如下:(1)基于特征描述和分类的公共场所行人检测算法。本文针对公共场所中行人检测中存在的遮挡、姿态多样性等难点,仅采用头肩部位作为特征描述对象,提出并实现基于特征提取和分类的方法完成行人检测方案。(2)单目相机下的人体三维姿态估计。本文在单目相机、缺少深度信息的情况下,对人体三维姿态进行了尝试性地研究实验。采用手动标定完成初始动作的初始化,基于退火粒子滤波的方法用权重衡量动作序列的连续性,以减少人体运动对深度信息的依赖,并对不同的动作序列进行了实验和误差分析。(3)表观模型和可变模型结合的人脸检测算法。对于人脸检测问题,本文在人脸局部部位表观匹配的基础上,加入了描述人脸拓扑结构变化的可变模型,采用动态规划的思想,在全局完成最优匹配,最后采用并行计算理论对算法进行优化,提高算法的实用性。