基于传感器和强化学习的移动机器人导航研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:wangzhaolinghappy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动机器人是一门多学科相交叉的综合性课题,它涉及的理论知识和技术方法十分广泛,已成为机器人学、人工智能等领域的重要研究方向。目前其研究成果已经在民用、工业和军事中得到了广泛的应用。 传感器系统是移动机器人获取外界环境信息最重要的途径,也是移动机器人执行各种工作任务的基础,感知系统的优劣将直接影响移动机器人的性能和效率。因此本文对移动机器人视觉传感器和超声传感器进行了研究,目的是提高移动机器人感知系统的性能,使其能够获得更精确、更完善的环境信息。 此外,如何提高移动机器人的自主能力和对环境的适应性是实现移动机器人在不确定环境中完成复杂任务的关键问题。强化学习是一种有效的非监督机器学习方法,应用强化学习方法能够使机器人在没有教师信号指导的条件下,通过与环境的交互来掌握导航策略和行为能力。基于此,本文深入研究了强化学习的算法以及它在移动机器人中的应用,目的是提高移动机器人的智能水平、自学习能力以及对环境的适应性。 本文根据此背景展开了研究工作,主要对移动机器人视觉系统,超声传感器系统,强化学习相关方法及其在移动机器人中的应用,慎思、反应式移动机器人导航等问题进行了深入的研究,内容如下: 首先,基于嵌入式智能移动机器人平台,建立了分布式视觉系统结构。对自主足球机器人视觉处理所涉及的关键技术和主要算法进行了探讨和研究。 然后,研究了移动机器人超声传感器信息融合方法,通过融合多个超声传感器信息来建立机器人工作环境的不确定性网格地图。基于网格地图进行两阶段路径规划,实现移动机器人的慎思式导航。 其次,分别提出了两种表格型强化学习算法,并研究了它们在移动机器人反应式行为学习中的应用。第一种方法是使用矢量量化技术来量化强化学习的状态空间,将矢量量化的码书作为强化学习状态空间的量化矢量,从而构成表格型强化学习算法。另一种为基于模糊极小—极大神经网络的强化学习在线状态空间分割方法,可以在强化学习进行的同时完成状态空间的自适应分割。 再次,研究了一种基于函数逼近的强化学习方法,通过模糊神经网络来实现强化学习状态空间到动作空间的映射,并使用残差算法来完成网络的误差反向传播学习。同时应用该方法实现了移动机器人复杂导航任务的学习。接着,针对强化学习收敛速度过慢的问题,研究了提高强化学习速度的方法。分别通过嵌入专家知识和使用经验回放技术来提高强化学习算法的执行效率。 之后,对自适应启发评价(AHC)强化学习算法进行了研究,并使用它来实现移动机器人路径跟踪行为的学习,AHC的评价单元使用前向神经网络来实现。AHC的动作单元由模糊推理系统构成,同时使用遗传算法来优化模糊规则库。 接下来,提出了机器人足球决策系统的分级学习结构,将复杂任务分解为多个子任务。分别使用强化学习方法来实现各级决策任务的学习和足球机器人基本技术动作的设计。 最后,总结了本文的主要工作和研究成果,分析了目前研究工作中的不足,对未来的发展趋势和研究方向进行了展望。
其他文献
随着现代科学技术迅猛发展,人民生活水平日益提高,同时由于工作节奏的加快,各种疾病的发病率有所增加,其中最为常见和典型的便是大脑和心血管疾病,这是目前医学界最为关注、研究和
本文以大瑶山隧道监测项目为研究背景,在数字图像处理的基础上,采用小波变换技术对图像的恢复与复原作了较为深入的研究,并着重介绍了小波相关理论在图像去噪中的应用以及运
汽车空燃比控制和转速控制是发动机控制系统中的两个重要问题。为了使汽车满足一定的排放要求,同时具有良好的驾驶性能,需要对发动机的空燃比和转速进行控制。这是因为三元催
学位
在模糊CCC算法的基础上提出了一种改进措施,并通过理论分析和仿真分析说明了改进的模糊CCC算法的有效性;构造了神经网络实现了改进的模糊CCC算法——模糊CCC神经网络,给出了模糊
电动执行机构又称阀门控制器,作为现场级的工业控制设备,它广泛应用于电力、冶金、石油、化工等部门的自动控制领域。随着生产过程中控制要求的不断提高和控制系统复杂程度的不
支持向量机(SVM)是国际上机器学习领域新的研究热点,是统计学习理论发展的一种新的通用学习算法,本文对支持向量机用于频移键控(FSK)通讯解码技术进行了探索性应用研究。结合支
网络控制系统以通信网络作为传感器、控制器和执行器之间的通信媒质,是网络通信和自动控制相结合的产物,近年来网络控制系统的研究已成为控制界的热点。本文主要对基于CAN总线
本文对智能教学系统的有关概念、教学理论、知识表示进行了深入探讨。在对智能教学系统的历史、现状及其发展趋势进行分析的基础上,提出了一个基于WEB上的智能教学系统。文中
现场总线是以开放互连通信模型为基础的网络集成自动控制技术,它采用数字化通信方式、智能化测控设备、全分散控制结构及开放性互连规范,使其可以彻底打破传统自动化系统信息孤