【摘 要】
:
Q-learning是一种经典的增强学习算法,简单易用且不需要环境模型;广泛应用于移动机器人路径规划。但在状态空间和动作空间较大时,经典的Q-learning算法存在学习效率低、收敛
【机 构】
:
沈阳新松机器人自动化股份有限公司特种机器人BG,沈阳科技学院机械与交通工程系
论文部分内容阅读
Q-learning是一种经典的增强学习算法,简单易用且不需要环境模型;广泛应用于移动机器人路径规划。但在状态空间和动作空间较大时,经典的Q-learning算法存在学习效率低、收敛速度慢,容易陷入局部最优解等问题。通过引入神经网络模型,利用地图信息计算状态势值,从而优化了设计奖励函数。合理奖励函数为Q(λ)-learning算法提供了先验知识,避免训练中的盲目搜索,同时奖励函数激励避免了陷入局部最优解。仿真试验表明,改进的路径规划方法在收敛速度方面有很大的提升,训练得到的路径为全局最优。
其他文献
目的:通过探讨影响居民对社区卫生服务满意度的重要因素,提出提高居民对社区卫生服务满意度的建议。方法:采用随机抽样调查法抽取崇川区5个社区。结果:居民对社区卫生服务机构医
普洱茶是我国独有的茶叶品种,深受国内外消费者的喜爱;同时,普洱茶也是云南少数民族地区重要的经济作物,发展普洱茶生产有利于云南茶叶结构调整和茶农收入增加。2007年至今,在经受
德国商品检验机构最近发布的一份针对3岁以下儿童玩具的检查报告显示:超过八成玩具被检测到含有毒成份。
本文分析原有肾透析流程存在的问题,研究相关文件并结合实际经验,制定出肾透析护理的临床路径。通过临床路径在糖尿病肾透析患者护理管理中应用的实践探讨,结果显示临床路径
澳大利亚2009年玩具、嗜好品及育儿产品展近日在墨尔本展览中心召开。共13个展区展出了最新的玩具、嗜好品、婴幼儿产品、游戏以及其它儿童及家庭休闲学习和娱乐产品。这个由
日前,经国家科技部火炬高技术产业开发中心审查认定,澄海区获准建立。圜家火炬计划汕头澄海智能玩具创意设计与制造产业基地”。这是目前圆家火炬计划中唯一被认定的玩具制造产
中国的动漫产业一直不赚钱,日本却是春风得意红红火火。日本的卡通成功多来自玩具和娱乐背景公司的支持,其卡通核心玩具的收入是支撑动漫发展的重要来源。日本的经验结合中国
数学运算是数学核心素养的重要组成部分。口算教学是小学数学中的重点教学内容,口算能力也是学生在数学学习中需要重点掌握的一项技能。具备数学素养的人可以从数学的角度看待问题,用数学的思维方法思考问题,用数学的方法解决问题。通过口算教学可以迅速地培养小学生的数学运算能力,使学生学会数学的思维方式,同时数学能力的培养对于小学生的长远发展具有重要的现实意义,也是小学数学教学的重要目标之一。本研究采用文献研究法
国外创业教育已形成了各具特色的培养体系。我国构建适应学生发展需求、有效提高学生创业率的创业教育体系,具有十分重要的意义。从激发学生的创业意识、培养学生的创业精神