论文部分内容阅读
移动机器人凭借着其自身优秀的能力,已经越来越多地应用在人类生活的各个方面。如何脱离人工控制而实现自主能力是移动机器人的总要难题。移动机器人应用在消防救援任务时,传统的方法是人工远程控制机器人进行探索,这种被动感知的方法受限于操作人员的个人素质以及工作经验,且不能保证环境信息的实时性。本文提出协同主动感知的方法,使其应用到移动消防机器人的环境探测中。针对传统的人为远程控制机器人执行灾害救援任务中的固有缺陷,提出了基于贝叶斯推理的状态估计器和基于Q-learning的强化学习决策,使得机器人能够在未知环境下执行主动的环境探索。针对传统路径规划方法在面对大规模场景以及多机器人系统的任务时计算量大且难以获得最优解的情况,设计了基于自组织映射网络的快速遍历方法,为机器人团队快速规划出时间最短的路径。论文的主要工作如下:1.介绍了主动感知这一问题的研究背景和现阶段取得的研究成果,移动机器人在消防救援任务的研究现状等,主要包括分析了人工智能的三个阶段以及研究主动感知的重要性、主动感知的发展以及国内外学者提出的相关理论和取得的成果,并且对移动机器人应用在消防救援领域的传统方法以及存在的问题进行了详尽的分析。2.定义主动感知的研究目的,提出了主动感知系统模型,分析了主动感知与被动感知、主动感知与反馈控制的区别与联系,总结出了“状态估计与决策”组合的移动机器人主动感知系统模型。3.研究了自适应粒子滤波的状态估计方法,提出了基于贝叶斯推理的机器人状态估计方法,包括运动畸变处理、后端非线性处理方法、自适应粒子滤波理论,并给出了仿真实验分析,实现了主动感知中状态估计器的设计。4.论述了基于强化学习方法的主动感知探索策略,包括强化学习的基本介绍、马尔可夫过程的数学定义、Q-learning算法的实现过程,以及仿真实验的设计,并结合贝叶斯推理的状态估计器实现了未知环境下机器人的主动探索。5.分析了已知环境信息下机器人团队协同快速遍历所有目标的主动感知方法,包括机器人团队的协同方式、多旅行商问题的数学模型、自组织映射的基本原理及实现方法。6.论述了机器人系统的体系结构和实验设计,包括硬件选择、软件设计、实际测试。