基于点的POMDPs在线值迭代算法

来源 :软件学报 | 被引量 : 0次 | 上传用户：wsd988

【摘要】

：

部分可观察马尔可夫决策过程（partially observable Markov decision processes，简称POMDPs）是动态不确定环境下序贯决策的理想模型，但是现有离线算法陷入信念状态“维数灾”和“

【作者】

：

仵博吴敏佘锦华

【机构】

：

中南大学信息科学与工程学院,先进控制与智能自动化湖南省工程实验室,深圳职业技术学院教育技术与信息中心,SchoolofComputerScience

【出处】

：

软件学报

【发表日期】

：

2013年1期

【关键词】

：

部分可观察马尔可夫决策过程信念状态基于点的算法在线算法与或树 POMDPs belief state point-based algorithm

【基金项目】

：

基金项目：国家自然科学基金（61074058,60874042）,国家教育部博士点基金（20090162120068）致谢感谢Poupart,Pineau和Ross等人基于Matlab语言开发的POMDPs软件包,在本文的实验中,复用了其中的很多代码.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

部分可观察马尔可夫决策过程（partially observable Markov decision processes，简称POMDPs）是动态不确定环境下序贯决策的理想模型，但是现有离线算法陷入信念状态“维数灾”和“历史灾”问题，而现有在线算法无法同时满足低误差与高实时性的要求，造成理想的POMDPs模型无法在实际工程中得到应用．对此，提出一种基于点的POMDPs在线值迭代算法（point-based online valueiteration，简称PBOVI）．该算法在给定的可达信念状态点上进行更新

其他文献

高校图书馆读者双变量细分与针对性服务策略

本文以提高高校图书馆服务质量为目标,论述了读者细分对提高读者服务质量的作用。采用双变量细分法对高校图书馆读者类型以主体身份和年龄的不同进行细分,探讨了不同读者类型

期刊

高校图书馆读者细分针对性服务

基于指向更新的优先权指针分析算法

指针分析是数据流分析中的关键性技术，其分析结果是编译优化和程序变换的基础．在基于包含的指针分析算法研究的基础上，对Narse优先权约束评估算法中存在的冗余约束评估和优先权

期刊

指针分析数据流分析指向集流不敏感pointer analysis dataflow analysis points-to set flow-ins

近似理想格上的全同态加密方案

构造高效、安全的全同态加密方案目前仍然是一个公开问题.通过扩展近似GCD到近似理想格的方法,首先构造一个基于整数上部分近似理想格问题(PAILP)的有点同态加密方案,并使用G

期刊

全同态加密近似理想格问题近似GCD整数分解稀疏子集和

培养创新人才的师资队伍建设

创业教育离不开高素质的师资队伍,高职院校按照创业教育的要求把选拔与培养创业教育的优质师资提到重要日程上来,组建一支由创业教育理论专家、技术专家、政府人员、成功的企

期刊

高职院校创业教育师资队伍建设

职业学校提高技能教学质量例谈

明确目标、优化过程、追求质量,是提高技能教学水平的关键.

期刊

教学质量职业学校技能明确目标优化过程教学水平

基于点的POMDPs在线值迭代算法

其他学术论文