基于强化学习的自主移动机器人导航研究

来源 :东北师范大学 | 被引量 : 10次 | 上传用户:Moon_____light
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
未知环境下移动机器人缺少先验知识,移动机器人自主学习以提高对环境的适应能力,是实现移动机器人在未知、复杂环境中成功应用的关键。反应式导航是提高移动机器人在未知环境下实时性和适应性的重要手段。近年来,在诸多反应式导航方法中,强化学习由于无需监督和先验知识、自学习和在线学习的特点使其具有在未知环境下导航的优越性。针对标准强化学习速度较慢,本文提出基于Q学习和粗糙集的自主导航方法。通过强化学习,机器人能够实现未知环境下的自主导航。由于机器人导航的知识具有不完备性,而粗糙集是处理不完备性的一种有效的数学工具。本文首先利用粗糙集理论处理机器人的初始导航知识,简化导航系统的复杂性。然后将它与Q学习结合,加快了机器人学习的速度,从而提高了导航系统的避碰能力。同时,由于在复杂连续环境下,强化学习系统面临“维数灾难”问题,需要采取量化的方法,降低输入空间的复杂度,而径向基神经网络(RBFNN)具有较强的函数逼近能力及泛化能力,由此提出了基于RBF神经网络的Q学习方法并将其应用于单机器人的自主导航。用径向基神经网络逼近状态空间和Q函数,使学习系统具有良好的泛化能力。最后,在TeamBots平台上将提出的两种导航方法仿真实现。仿真结果显示,基于Q学习和粗糙集的自主机器人导航方法较与标准Q学习相比,可以增加自主机器人对环境的适应性,提高避碰能力,加速导航学习过程;基于RBF神经网络的Q学习导航方法具有较强的避碰能力,提高了机器人对环境的适应能力。
其他文献
Web是信息化时代到来的标志之一。Web是互联网上最重要的,也是与普通的用户最贴近的应用。自1989年诞生以来,Web不断更新发展,从最初的静态HTML页面,到现在的动态Web页面;从
物流业已成为国际经济体系的重要组成部分,是推动经济全球化的重要服务业。但是物流费用居高不下,特别是运输费用占社会物流费用的比重达到一半以上,是影响物流成本的重要因
基于面向对象的分析、设计方法的出现使得软件的开发方法发生了翻天覆地的变化。随之而来的是面向对象的建模语言的(以UML为代表)、软件复用、基于组件的软件开发等新的方法和
随着多媒体技术和计算机网络的快速发展,数字媒体的制作和传播变得更加方便和快捷,同时盗版和版权问题也日趋严重。多媒体信息安全已成为一个迫切需要解决的问题。数字水印技
头部三维运动的模拟问题涉及计算机视觉、计算机图形学、图像处理、模式识别和人工智能等学科领域,是一个具有挑战性的跨学科研究课题,它在动画与游戏、智能人机交互、智能监
在大规模复杂的多Agent系统(MAS)中,多个Agent之间的协调、合作尤为重要。联盟机制是Agent之间合作的重要方式,联盟生成是多Agent系统的首要组成部分,利用智能优化算法来求解
计算技术和无线通讯技术的发展使得一种全新的计算模式—移动计算成为现实。移动计算设备广泛使用和通讯、硬件技术及相应软件技术发展,使得这种计算模式得到了飞速的发展,并
本课题以中南大学湘雅附二医院器官移植中心的病例管理信息系统的开发为背景,详细探讨了在医院信息化过程中的病例信息管理网络化、数字化建设方案,基于安全性和数据挖掘的系
移动Ad Hoc网络是一种高度动态的无线网络,路由成为其实际应用中必须解决的关键问题。目前的路由协议在节能上大多表现得不好。由于组成非固定设施网络Ad Hoc网络的移动节点
随着因特网商业化革命和网络技术的不断发展,融合了数据、视频、音频业务的多媒体通信业务得到了飞速的发展,并将成为下一代网络NGN的主流业务之一。软交换作为NGN网络的核心