基于采样的POMDP近似算法

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:qq616009003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
部分可观察马尔科夫决策过程(POMDP)是一种描述机器人在动态不确定环境下行动选择的问题模型。对于具有稀疏转移矩阵的POMDP问题模型,该文提出了一种求解该问题模型的快速近似算法。该算法首先利用QMDP算法产生的策略进行信念空间采样,并通过点迭代算法快速生成POMDP值函数,从而产生近似的最优行动选择策略。在相同的POMDP试验模型上,执行该算法产生的策略得到的回报值与执行其他近似算法产生的策略得到的回报值相当,但该算法计算速度快,它产生的策略表示向量集合小于现有其他近似算法产生的集合。因此,它比这些近似
其他文献
指导学生做好课前预习并使学生养成良好的预习习惯是小学语文教学的重要环节.在实际教学工作中,笔者总结出"一标""二查""三读""四做""五疑"的预习方法,并在教学中初见成效.
以我国犯罪概念为理论依据,运用逻辑分析方法,充分论证了组织残疾人、儿童乞讨罪将犯罪对象界定为残疾人和不满14周岁的未成年人的合理性以及在客观方面将暴力、胁迫方法规定为
我国境外业务内部审计工作总体开展状况能否适应当前"走出去"政策背景的发展需求亟待探究。中国电建集团作为"一带一路"战略实施的主力军,在集团境外业务内部审计工作中取得了丰
伴随气候变化与快速城市化,超大城市与城市群高温、暴雨、雾霾极端灾害事件频繁,生态环境问题愈加突出。应对气候变化的城市规划是缓解与适应极端事件的重要手段,它通过优化
<正> 祥林嫂是中国现代文学史上最引人注目的艺术形象之一,她生动地、深刻地、真实地反映了旧中国劳动妇女的悲惨命运。几十年来,人们对《祝福》、祥林嫂形象研究、讨论得比
<正>自然界中,一些野生动物为了觅食或繁殖,会随着季节沿固定或非固定路线从一处栖息地转换到另一处栖息地。这些野生动物常常跨越国界进行长距离的迁徙或洄游,其生存容易受
现阶段,在传统教育观念和模式的影响下,《传感器与检测技术》课程教学很难得到有效发展,在这种模式下培养出来的人才无法适应社会的需求。CDIO理念作为一项近年来国际教育研
为了研究适合于3D打印服装的材料,对柔性PLA材料在3D打印机中熔融喷丝前后的分子结构、热性能、拉伸性及回弹性进行测试分析。结果表明:柔性PLA材料高温熔融喷丝前后的内部分
自移动清洁机器人作为智能移动机器人的一个特殊的应用,能够代替重复性的体力劳动,降低人工劳动强度,具有广阔的市场前景。虽然该技术领域的技术成熟度已经非常高,但作为一种
阐述高精度激光准直系统的总体构成及特点,着重分析高斯激光束经过薄透镜的变换规律、最佳准直区域以及激光准直光学系统的设计思路。给出系统光电接收转换元件的主要技术参