部分可观察马尔可夫决策过程研究进展

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:baobeizhu66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
部分可观察马尔可夫决策过程是通过引入信念状态空间将非马尔可夫链问题转化为马尔可夫链问题来求解,其描述真实世界的特性使它成为研究随机决策过程的重要分支。介绍了部分可观察马尔可夫决策过程的基本原理和决策过程,然后介绍了3种典型的算法,它们分别是Littman等人的Witness算法、Incremental Pruning算法和Pineau等人的基于点的值迭代算法,对这3种算法进行了分析比较。讲述部分可观察马尔可夫决策过程的应用。
其他文献
2010年2月在北京召开的核级DEL水冷式冷水机组科学技术成果鉴定会上,专家组认为,DEL冷水机组技术性能达到国际同类产品先进水平,打破了国外公司对这类产品的垄断。
<正>蛋白质作为人体必须的营养素之一,其消化吸收已经成为大众关注的热点之一。过去人们一直认为人体吸收的蛋白质主要是以氨基酸的形式。近年来研究发现,蛋白质经消化道酶促
真实的模拟光线的透射效果是实时计算机图形学中一个非常令人关注的内容。对于这种自然现象的模拟所要达到的两个目标是真实性和实时性。为了达到这一要求,介绍了一种能够实时并且真实的模拟这种自然现象的算法,在Microsoft Visual Studio开发环境下,利用DirectX 9.0软件包进行3D开发,并结合shader技术编程实现,运行的结果表明此算法是可行的和高效的。
一项探索解决“市场煤”、“计划电”矛盾的煤电一体化项目——安徽风台电厂一期工程首台1号600MW超临界发电机组顺利通过168h满负荷试运行并向电力缺口较大的浙江开始送电。
在2009年的聚风季来临之际,弗罗里达的动力与照明公司(FPL)提前做好准备,制定了骤风歼灭计划(“dryrun”)并成立专门的抢险队。该紧急计划包括停电跟踪、损失评估与用户及员工通信
针对星球机器人分布计算系统容错的可靠组播通信,提出了一种基于向量时间的原子组组播协议。协议从星球机器人分布计算系统及通信模型的特点出发,使用向量时间和令牌进程来标识
小儿脏腑娇嫩,脾常不足,受到内外因素影响时首先是脾胃先受到损害。在生长发育过程中泄泻是临床最常见也是持续时间较长的疾病,本文分析中医学传统外治灸法和中药内服综合治
分析了不同燃料形式发电对大气环境的污染及影响,定量地对不同形式的发电污染排放进行了计算,包括二氧化碳、烟尘、硫化物、氮氧化物、热量的排放,提出了降低排放的主要途径。认
长期以来,我国电力发展以区域就地平衡为主,在中东部负荷中心地区大规模布局煤电导致当地环境问题日益严重。介绍我国电力行业大气环境污染物排放现状,从硫沉降环境承载力、现有
基于DCT系数的信息隐藏算法开发了一个可行的信息隐藏系统,基本实现了隐藏信息的嵌入和提取,平均相似度达到93.83%,精确度较高。通过从图像的基本特征如RGB值、亮度值,以及隐