论文部分内容阅读
该文的研究重点是基于视觉信息的感知和判断,主要包括"基于姿态识别的人机交互"和"非结构场景下的移动机器人自主导航"两方面的内容,其中涉及到的问题有人脸定位、头部姿态识别与跟踪、手势跟踪、动态手势识别、自定位、路径规划和场景学习等.在该文中,我们以智能轮椅为平台,对这些智能服务型机器人的共性和关键问题逐一开展了研究.智能服务型机器人所处的环境往往是动态和非结构的场景,环境的不确定性给机器人的感知和判断增加了难度.因此,我们使用概率模型来描述场景的不确定性,把目标的检测、跟踪和位置识别等问题转化成基于观测或观测序列的状态估计问题来处理,这个思路贯穿该文的所有章节.该文工作的贡献体现在以下四个方面:①遵循Asimov的机器人法则,提出智能轮椅设计应遵循的四个原则,并设计出了一台多模态交互式智能轮椅.这个机器人平台具有硬件体系上的信息多通道性、软件体系上的多任务性和控制模式的多类型性等特点.②深入研究了动态场景下的人脸头部姿态的识别、定位和跟踪问题.通过定义头部姿态的状态量,使用概率推理方式对头部姿态的识别、定位和跟踪问题给出了一个统一的解释.其中,头部姿态识别是作为系统状态的观测模型而提出的.为了提高姿态识别对于变化光照的鲁棒性,我们提出先用碗状带通滤波器提取出较稳定的头部姿态的表现信息,再用概率主元分析对姿态簇建模的方法实现头部姿态识别.头部姿态的检测和跟踪表现为对系统后验概率的估计,我们采用粒子滤波的方法估计后验概率,将头部的肤色信息、形状信息和运动信息结合到粒子的采样过程中,通过分区采样的策略实现了实时的检测和跟踪.③提出了一种改进的粒子滤波器,并将其应用于手势的跟踪.这种粒子滤波器将粒子的均值漂移加入到粒子滤波过程当中,在一定程度上避免了粒子滤波中的采样恶化问题和采样枯竭问题,提高了有效粒子的数目.在实时手势跟踪的基础之上,我们提出基于时序模板的轨迹分析方法,并用两层分类器实现了对7种动态手势的识别.④提出"三层导航体系结构"和"基于贝叶斯滤波的序列图像直方图匹配方法"解决非结构场景下的移动机器人导航问题.三层导航结构由拓扑层、任务层和控制层组成,将导航中的自定位、路径规划和随机避障等操作有机地结合起来,把抽象的导航任务逐层分解成导航行为和导航控制码,有效地实现了智能轮椅的自主导航.采用贝叶斯滤波理论的序列图像直方图匹配方法将导航中的上下文信息引入到位置识别中,使智能轮椅在动态场景下的位置识别正确率得到了显著的提高.