【摘 要】
:
交互式动态影响图(interactive dynamic influence diagrams)是不确定环境下多Agent(Mult-Agent)序贯决策(Sequential Decision)的图模型[1]。马尔可夫决策过程可以用来描述
论文部分内容阅读
交互式动态影响图(interactive dynamic influence diagrams)是不确定环境下多Agent(Mult-Agent)序贯决策(Sequential Decision)的图模型[1]。马尔可夫决策过程可以用来描述和处理大规模不确定性环境下的Agent决策问题。本文以马尔可夫决策过程的相关理论为基础,以众多研究者关注的Agent决策为核心,重点分析I-DIDs模型下的求解算法效率。
Interactive dynamic influence diagrams are multi-agent sequential models (Sequential Decision) graph model in uncertain environment [1]. Markov decision process can be used to describe and deal with the problem of Agent decision in large-scale uncertain environment. Based on the related theory of Markov decision process and the Agent decision that many researchers pay attention to, this paper focuses on analyzing the efficiency of the algorithm in I-DIDs model.
其他文献
目的:探讨系统性红斑狼疮(SLE)患者红细胞Ⅰ型补体受体(ECR1)密度相关基因多态性分布与SLE患者临床表型间的相关性.方法:采用聚合酶链式反应(PCR)结合Hind Ⅲ内切酶限制性片
根据GB 19154-2003《擦窗机》中对防倾覆装置的规定及要求,指出现在防倾覆反滚轮设计存在的问题,着重介绍一种新型防倾覆反滚轮的设计,阐述其优点并对其适应性加以分析。
Ac
基于武汉地铁3号线七标工程项目实际工况,深入分析了泥水盾构在含蒙脱土强风化泥岩中难以掘进的现象及原因,同时从盾构装备优化设计、掘进参数控制及施工管理等方面,提出了针
成对轴承的装配的预紧是常见的问题,以推土机轮边减速器为例,计算出轴承在特定载荷谱下的最佳寿命,通过装配的尺寸链计算,并合理调整座孔和台阶的尺寸,使预紧量落在最佳的区
本文结合某城市地质情况,对用于该地层的盾构刀盘结构进行了针对性设计,并在不同工况下对刀盘结构进行了有限元分析,分写结果表明,刀盘结构设计满足工程使用要求,为刀盘结构
外立面分段施工方法,是高层建筑缩短工期的有效途径之一,本文主要以贵阳“未来方舟”H3组团项目的外立面竖向分段施工工程实例为载体,介绍了分段方法、主要施工措施及其分段
介绍了推土机液压油温过高故障由简单到复杂的排查原则、各部分的排查方法及原理,在理解的基础上逐一排查,以最经济高效的方法解决问题。
This paper introduces the princi
对市场在用的平地机刀片进行失效形式分析,并研究了改进后的新热处理工艺对平地机刀片金相组织和耐磨性的影响。新热处理工艺中金相组织为均匀分布的回火马氏体,具有较高的强
目的 通过对山东省大部分单位普通级大、小鼠病原体携带状况的调查 ,了解省内实验动物质量情况 ,以利于新国标的宣传和执行。方法 选取省内不同地区、不同单位的普通级大、
为选定适合的实验室测糖方法,分别采用浓硫酸外加热法、稀硫酸外加热法及水合热法等设置的不同加热时间对蔗糖标准样品进行测试,并对其易操作性、数据稳定性等方面进行综合比