基于强化学习的智能体自主导航技术研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zzhang123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能体自主导航旨在让智能体像人一样具备安全高效的从起点移动到目标点,并且不和其他障碍物发生碰撞的能力。该技术是移动机器人实现更多高级功能的基础,是人工智能领域研究的重点之一。随着机器人应用场景的不断扩展,传统的智能体导航技术已经逐渐不能满足实际需要。本文围绕智能体自主导航问题,利用深度强化学习技术开展研究。首先,本文研究了基于深度强化学习技术的单智能体自主导航方法。针对DDPG实现单智能体的自主导航时只能利用少量状态信息的缺点,引入了长短时记忆网络对智能体经过的历史信息进行编码,以改进导航效果。通过在Stage-ROS平台搭建仿真实验环境,对上述算法在单智能体自主导航场景中的表现进行了测试。实验结果表明,改进后的算法(LSTM-DDPG)相对于DDPG算法有更好的表现。其次,本文研究了基于深度强化学习技术的多智能体自主导航方法,针对MADDPG算法在分散执行时没有系统全局视野的特点,在MADDPG算法的基础上引入长短时记忆网络对系统的历史状态信息进行编码,并将此编码信息传递给策略网络用以改善MADDPG算法在多智能体自主导航场景的表现。本文所提出的方法能够改善DDPG算法“灾难性的遗忘”问题以及MADDPG算法在执行时没有全局视野的缺点,改善智能体的自主导航表现,对于智能体自主导航问题的研究和实际应用有一定的推动作用。
其他文献
近年来,中国城市化的快速推进与人口的增长,使城市生态环境遭到严重破坏,城市滨水公园作为城市绿色公共空间的组成部分,对城市环境的保护和提升有着不可忽视的积极作用。同时
近年来,海外汉语学习已呈现出低龄化发展的趋势,印度尼西亚的三语幼儿园形成了以语言知识为主的多课程教学体系,其中汉语古诗的教学也成为较为突出的课程内容。但目前海外幼儿古诗教学还处于起步阶段,在教学上出现较多问题需要改进,学界对此缺乏关注和研究。因此,如何针对海外幼儿开展古诗教学成为对外汉语教学的一个亟待解决的问题。本文从游戏教学法视角出发,综合运用课堂观察、问卷调查和访谈等研究方法分析了游戏教学法在
次氯酸作为一种强氧化剂应用广泛,在生活中常被用作漂白剂、消毒剂、除臭剂,生活自来水的消毒采用的氯化法也是依靠氯气溶于水产生的次氯酸将水中的臭味无机物及天然物质氧化
在山东省药物研究院教学实验楼方案设计中,探索传统建筑形态的新的表现形式与现代建筑空间的有机结合,营造层次丰富的教育空间。
汉语文化课指的是在课堂类型上区别于以语音、语法、词汇等为主要教学要素的以中国文化为基本内容的文化教学活动。当下,越来越多的韩国中小学开设了汉语课堂,它们不仅重视语言知识的习得,也十分注重中国文化的学习。本文以笔者在韩的汉语教学经历为依据,着重对文化教学进行了归结与反思。绪论部分重点阐述了本文的选题背景和意义,并对前人研究成果进行了适当的归纳,最后简要介绍了本文的研究思路、研究内容和研究方法。第一章
本文认为,人力资源会计制度设计应包含8个方面的问题(即8个W):1.What:什么是人力资源会计?2.Why:为什么要建立人力资源会计?3.Who:由谁来开展人力资源会计?4.When:何时开始动
语言是文化的负载体,文化与传播又密不可分。因此在跨文化交际活动中,翻译就担起了文化传播的重任。汉语文化负载词是中国最鲜活的文化印记,汉语文化负载词的英译会在很大程
随着放射科全面进行数字化摄片以后,工作及管理流程均发生了改变。应用PDCA管理循环结合继续教育来管理数字化摄片质控工作,制定质控检查及继续教育的计划和要求,分为计划制
写意电影是相对于写实电影的一种电影类型,它是重在传情达意、营构意境和表达含蓄。中国写意电影诞生于上个世纪三十年代,其后经由数代导演的努力,已产生许多作品,成为中国电
在高压聚乙烯装置的挤压造粒系统中,切粒机的切刀极易被损坏,进而导致产生拉丝料、片料、尾巴料、金检料等不合格料,严重影响产品质量,同时必要时需要停车处理,影响装置的正