未知动态环境中基于分层强化学习的移动机器人路径规划

来源 :机器人 | 被引量 : 0次 | 上传用户:pailfj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于分层强化学习的移动机器人路径规划算法.该算法利用强化学习方法的无环境模型学习能力以及分层强化学习方法的局部策略更新能力,克服了路径规划方法对全局环境的静态信息或动态障碍物的运动信息的依赖性.仿真实验结果表明了算法的可行性,尽管在规划速度上没有明显的优势,但其应对未知动态环境的学习能力是现有其它方法无法比拟的.
其他文献
期现套利是未来一段时间内国债期货的重要投资方式。研究表明,在我国目前的金融市场条件下,正向、反向期现套利均可实现,但反向套利只适合机构投资者参与,个人投资者还存在融
本文研究金字塔结构对在职消费程度的影响。运用我国上市公司2004~2009年的面板数据固定效应回归模型,研究发现:(1)金字塔结构的层级越多,在职消费程度越高,而金字塔结构控制
环渤海经济区是以京津冀为中心,辽东半岛和山东半岛为两翼的特殊经济体,在珠江三角洲和长江三角洲之后,环渤海经济区成为了我国区域经济的第三极,但是,由于资源环境各项因素的制约,环渤海地区的经济发展速度与长三角和珠三角相比却很缓慢,因此又被称为中国区域经济发展的“慢热第三极”。要想提高环渤海地区的可持续发展水平,就要求我们必须尽快提高该地区的生态效率,提高经济资源环境的投入与各项产出比。首先,利用剔除了
<正>卵巢癌死亡率高居女性生殖道恶性肿瘤之首位,病理类型/分子类型均复杂,病理类型以上皮性卵巢癌为主。2012年全球新发病例238700例,死亡151900例~[1];2015年我国新发52100
生态服务是向整个社会共同提供的。全体社会成员联合消费。共同受益。即它具有效用的非分割性、消费的非竞争性和受益的非排他性。森林生态服务便是这类物品或服务的突出代表
利用2010年我国A股上市公司及其签字注册会计师的数据,以操控性应计的绝对值作为审计质量的替代变量,对签字注册会计师个人特征与审计质量之间的关系进行了实证检验。研究发
文章从区域经济联系潜力、产业结构互补性、市场互通性和生产活动关联性四个维度构建了湖北省区域经济联系评价体系,并测算了湖北省2000—2015年的区域经济联系指数。通过测
当前我国智慧城市建设进入新阶段,新理念、新模式、新应用层出不穷。针对我国智慧城市建设运营过程中存在的建设资金缺口大、数据应用差、产业带动弱的普遍问题,借鉴国内外先
自发性大肠破裂是指无明显病变或外伤因素,有腹压增高诱因或无明显诱因下突发直结肠破裂。本病为少见病,确诊率低,死亡率高,多发于中老年人。现就本院2002年以来收治的自发性