【摘 要】
:
研究基于深度强化学习技术的避障场景的算法模型设计,采用改进的深度Q网络(Deep Q-learning Network,DQN)算法克服了Q-learning表格式算法在连续状态下导致内存不足的局限性
论文部分内容阅读
研究基于深度强化学习技术的避障场景的算法模型设计,采用改进的深度Q网络(Deep Q-learning Network,DQN)算法克服了Q-learning表格式算法在连续状态下导致内存不足的局限性。鉴于学习过程中奖励稀疏导致很难获得较好结果的情况,改进奖励机制,增加实时奖惩作为补充,解决学习耗时长和训练不稳定的问题;采用相对角度、位置和距离等信息,相比绝对坐标信息可以更有效的躲避障碍物。不同于基于栅格法/可视图法等传统人为策略避障算法,深度强化学习算法DQN能够在缺乏先验知识的条件下具备自主决策能力,因此适用性更强。该技术可应用在仓储无人车、巡检机器人、无人机等现实场景。
其他文献
本文主要介绍地质行业内对铁矿石中二氧化硅分析的几种较常见方法。
针对目前重交通作用所造成的现有水泥混凝土路面损坏严重的现状,许多路段无法保证正常的运行,如何充分利用其老路残值,改造为新设计标准的路面,本文提出改造旧水泥混凝土路面
由于化工原料具有较强的氧化还原性,所以在对化工原料进行加工生产的过程中,通常会出现具有强腐蚀性、易燃性以及剧毒性的化学物质,直接影响到了化工操作人员的人身安全问题
一、工程概况1、工程位置:湖北省宜昌市三峡大学.2、工程名称规模及安装内容:真空管太阳能热水系统供货及安装.3、本项目概况本项目位于宜昌市.项目为学生公寓,共7层.太阳能热
随着我国经济的蓬勃发展,国际地位的提升,发展问题与现代化的矛盾也逐渐暴露了出来。页岩气具有十分重要的天然气资源,具有丰富的开发潜力,因此受到了国内许多企业的关注,因
江西粉石英资源特征及开发利用进展江西省建材料科研设计院方春霖一、资源概况粉石英是八十年代初在江西发现的一种新的非金属矿产资源,它不需要经过机械碾磨,采用水力分级工艺
介绍了红河钢铁有限公司轧钢厂棒材生产线成本控制面临的困难,棒材生产线设备水平不高,坯料供应不充足,技术管理低效,通过采用专坯专供提高成材率、控冷细晶化工艺优化和备件
近年来,在石油化工急速发展的过程中,油气储运技术的应用功不可没。然而现阶段,我国化工油气储运技术仍然具有诸多不足之处。鉴于这一原因,本文探讨了其技术中的主要问题,在
【正】 高校图书馆作为全校的资料中心,对视听资料也应当统一收集、整理和外借,以扩大服务项目.图书馆除对个人读者服务以外还要对各集体读者服务,这并不是说将电教