论文部分内容阅读
近年来,多机器人系统是机器人学研究中最令人感兴趣且富有挑战性的研究领域。多机器人的研究内容和应用范围十分广泛,如多机器人协作搬运,多机器人协作探索和地图构建,以及机器人足球赛等。多机器人系统能够完成单个机器人难以完成的工作任务。一队机器人通过协作可以用更可靠、更快速、更廉价的方法完成给定的任务。因此,关于多机器人协作的研究越来越受到研究者的重视。为了使机器人系统具有适应未知环境的能力,让机器人在与环境和其它机器人的相互作用中,学习和进化协作行为,是多机器人协作研究中最有潜力的方法之一。 本论文以多机器人协作搬运为研究背景,主要研究基于强化学习和合作协进化的多个机器人协作行为的获得方法。论文的主要研究成果如下: (1) 综述了多机器人协作的研究现状;全面地分析讨论了多机器人系统的分类、多机器人协作的主要研究内容、多机器人协作的主要研究方法和所取得的研究进展;系统地总结了进化和协进化方法研究机器人个体和群体行为的主要研究方式、研究结果和存在的主要问题;讨论了强化学习方法在多机器人行为学习中的应用及面临的困难。 (2) 设计开发了一个多机器人协作搬运多个物体的仿真环境,为基于学习和进化方法研究多机器人协作行为提供了一个良好的试验平台。 (3) 提出了一种获得多机器人协作行为的分布式两层强化学习方法,并以三个机器人通过强化学习,协作抬起一个园盘形物体的行为学习过程的仿真,验证了所提出的方法的有效性。 (4) 构建了一种基于状态预测的强化学习方法,讨论了算法的模型和实现方法;把所设计的算法应用于三个机器人通过学习,协作抬起一个物体的协作任务,给出了仿真结果。 (5) 以多个机器人合作完成多个物体的搬运为应用对象,提出了一种形成多机器人协作行为的多种群合作协进化方法。该方法由搬运任务的平衡分配和搬运序列的多种群合作协进化两个过程组成。实验结果表明所提出的方法具有更好的性能。 (6) 提出了一种机器人局部导航的改进势能场方法。通过采用圆形活动窗口、考虑机器人身体大小的斥力场设计方法和自适应的目标引力场设计方法,以及强化掌舵控制