论文部分内容阅读
移动机器人是一门多学科相交叉的综合性课题,它涉及的理论知识和技术方法十分广泛,已成为机器人学、人工智能等领域的重要研究方向。目前其研究成果已经在民用、工业和军事中得到了广泛的应用。
传感器系统是移动机器人获取外界环境信息最重要的途径,也是移动机器人执行各种工作任务的基础,感知系统的优劣将直接影响移动机器人的性能和效率。因此本文对移动机器人视觉传感器和超声传感器进行了研究,目的是提高移动机器人感知系统的性能,使其能够获得更精确、更完善的环境信息。
此外,如何提高移动机器人的自主能力和对环境的适应性是实现移动机器人在不确定环境中完成复杂任务的关键问题。强化学习是一种有效的非监督机器学习方法,应用强化学习方法能够使机器人在没有教师信号指导的条件下,通过与环境的交互来掌握导航策略和行为能力。基于此,本文深入研究了强化学习的算法以及它在移动机器人中的应用,目的是提高移动机器人的智能水平、自学习能力以及对环境的适应性。
本文根据此背景展开了研究工作,主要对移动机器人视觉系统,超声传感器系统,强化学习相关方法及其在移动机器人中的应用,慎思、反应式移动机器人导航等问题进行了深入的研究,内容如下:
首先,基于嵌入式智能移动机器人平台,建立了分布式视觉系统结构。对自主足球机器人视觉处理所涉及的关键技术和主要算法进行了探讨和研究。
然后,研究了移动机器人超声传感器信息融合方法,通过融合多个超声传感器信息来建立机器人工作环境的不确定性网格地图。基于网格地图进行两阶段路径规划,实现移动机器人的慎思式导航。
其次,分别提出了两种表格型强化学习算法,并研究了它们在移动机器人反应式行为学习中的应用。第一种方法是使用矢量量化技术来量化强化学习的状态空间,将矢量量化的码书作为强化学习状态空间的量化矢量,从而构成表格型强化学习算法。另一种为基于模糊极小—极大神经网络的强化学习在线状态空间分割方法,可以在强化学习进行的同时完成状态空间的自适应分割。
再次,研究了一种基于函数逼近的强化学习方法,通过模糊神经网络来实现强化学习状态空间到动作空间的映射,并使用残差算法来完成网络的误差反向传播学习。同时应用该方法实现了移动机器人复杂导航任务的学习。接着,针对强化学习收敛速度过慢的问题,研究了提高强化学习速度的方法。分别通过嵌入专家知识和使用经验回放技术来提高强化学习算法的执行效率。
之后,对自适应启发评价(AHC)强化学习算法进行了研究,并使用它来实现移动机器人路径跟踪行为的学习,AHC的评价单元使用前向神经网络来实现。AHC的动作单元由模糊推理系统构成,同时使用遗传算法来优化模糊规则库。
接下来,提出了机器人足球决策系统的分级学习结构,将复杂任务分解为多个子任务。分别使用强化学习方法来实现各级决策任务的学习和足球机器人基本技术动作的设计。
最后,总结了本文的主要工作和研究成果,分析了目前研究工作中的不足,对未来的发展趋势和研究方向进行了展望。