改进Q-Learning算法在路径规划中的应用

来源 :吉林大学学报：信息科学版 | 被引量 : 0次 | 上传用户：t_bear

【摘要】

：

针对Q-Learning算法在离散状态下存在运行效率低、学习速度慢等问题,提出一种改进的Q-Learning算法。改进后的算法在原有算法基础上增加了一层学习过程,对环境进行了深度学习

【作者】

：

高乐马天录刘凯张宇轩

【机构】

：

吉林大学仪器科学与电气工程学院

【出处】

：

吉林大学学报：信息科学版

【发表日期】

：

2018年4期

【关键词】

：

路径规划改进Q-Learning算法强化学习栅格法机器人 path planning improved Q-Learning algorithm rei

【基金项目】

：

吉林省重点科技攻关计划基金资助项目（20170204052GX）, 大学生创新创业训练基金资助项目（2016A65288）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对Q-Learning算法在离散状态下存在运行效率低、学习速度慢等问题,提出一种改进的Q-Learning算法。改进后的算法在原有算法基础上增加了一层学习过程,对环境进行了深度学习。在栅格环境下进行仿真实验,并成功地应用在多障碍物环境下移动机器人路径规划,结果证明了算法的可行性。改进Q-Learning算法以更快的速度收敛,学习次数明显减少,效率最大可提高20%。同时,该算法框架对解决同类问题具有较强的通用性。

其他文献

春玉米900公斤高产栽培技术模式

通过近几年实验、示范，总结出在滦平县中上等地力通过选用高产、耐密玉米品种，增加密度，改革种植方式，总结出亩产900公斤的栽培技术模式。

期刊

春玉米高产技术栽培模式

杨松视察省联投花山生态新城项目

本刊讯 6月4日．省政协主席杨松赴武汉市东湖新技术开发区．视察省联投集团花山生态新城项目建设情况。

期刊

生态视察杨松东湖新技术开发区项目建设政协主席武汉市

中国与欧美国家跨文化教育对比与思考

通过对中国与欧美国家跨文化教育对比和分析,提出了改进国内跨文化教育的建议及对策。

期刊