强化学习在机器人路径规划中的应用研究

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:testb321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究强化学习在机器人路径规划问题,作为基于行为的移动机器人路径规划,应具有实时、高效、快速的优点,但面对连续环境变量,如机器人通过传感器检测到的与障碍物的距离,存在状态表达和泛化问题,不恰当的状态泛化会影响系统的学习效率和收敛性。为了提高机器人对外界快速响应能力,在分析强化学习基本原理和连续状态泛化方法的基础上,提出利用Kohonen网络对机器人连续外部环境进行聚类的内部状态表示方法,给出了Kohonen网络的Q-Learning强化学习算法。根据机器人工作环境和路径规划目标,设计了机器人路径规划中的奖惩策略和动作选择规则,并通过仿真与传统的状态离散方法进行了比较。结果显示,提出的方法不仅降低了计算机的存储需求,而且加快了系统学习的收敛速度,表明了改进方法的有效性。
其他文献
【病例】女,51岁。因被拳击中后左胸不适20余天就诊。无特殊不适主诉及症状,以右前下纵隔肿瘤收入院。既往体健。胸部x线检查提示右胸心膈角肿物。胸部CT扫描示:前纵隔下部右心
人才投入产出模型及其应用上海财经大学基础部何其祥引言投入产出表充分反映了国民经济各部门在生产和分配中的经济技术联系,为经济分析、经济预测和政策模拟等提供了详尽的数
脑卒中是世界范围内发病率及死亡率较高的疾病之一,致残率高,步行能力受到较大影响,日常生活能力下降。减重步行训练(Body weight support treadmill training,BWSTT)近年来
近年来,随着社会的快速发展,教育的改革及国际交流的日益频繁,当今社会对人才的要求越来越高,改变传统教育理念及模式,引进最新教育理念及方法,对于促进教学效果的提升,及推
目的:探讨NSCLC(Non Small Cell Lung Cancer,非小细胞肺癌)患者中ZO-1(zonula occluden-1,紧密连接蛋白-1)蛋白检测的临床意义。方法:应用western blot检测101名NSCLC患者癌
在过去的几十年里,三族氮化物得到了大量的关注和开发,已经广泛应用于光电器件中,如发光二极管(LED)、激光二极管(LD)、紫外线(UV)探测器、太阳能电池、声表面波设备、高温和高频场效
1995年12月至1996年3月对果子狸的体温、采食量、呼吸、体重、活动规律进行了测试.结果表明,从12月22日至次年2月18日(先年冬至至次年雨水期间),果子狸度过了一个浅度的冬眠阶段,其标志为体温下降3~4℃,异
针对我国国家级职教师资培训基地的建设历史和现状分析,提出了基地建设时出现的问题,并提出了相应的对策。可对我国相关政策的制定及研究方向有所启示。
选取某乘用汽车悬架与导向杆之间的橡胶衬套为研究对象,在有限元软件Abaqus中建立该衬套的CAE模型,采用适当的橡胶超弹性计算方法模拟该衬套的静态加载过程,得到该衬套的静态
目的:通过检测子宫肌瘤子宫切除(保留双侧卵巢)术和子宫肌瘤剔除术后的性激素水平,为临床手术方式的选择和术后治疗提供参考。方法:选择2007年2月至2008年5月妇科收治的60例