可数状态MDP的平均模型

来源 :数学年刊:A辑 | 被引量 : 0次 | 上传用户:jjass
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文考虑可数状态空间任意行空间MDP的平均模型,分析了四个平均报酬准则,在通常的遍历性条件下,用鞅论的方法证明了其最优报酬值的一致性和最优策力的存在性,从而较好地解决了Feinberg和Park^「1」再次提及的Open问题。
其他文献
本文研究树(即不含有圆的一维紧致连通的分支流形)上连续自映射的非游荡集的拓扑结构。证明了孤立的周期点都是孤立的非游荡点。具有无限轨道的非游荡点集的聚点都是周期点集的
给出了不同学者关于量子力学态叠加原理的几种表述,分析比较了关于该原理的有关观点的争议,并对其中的原因进行了讨论.
综述了近年来关于硅橡胶填充体系的研究进展。主要介绍了白炭黑和硅树脂的补强机理,蒙脱土、碳纳米管、碳纤维及纳米碳酸钙等新兴填充材料对硅橡胶补强的研究进展以及采用双峰
目的 探究基于移动物联网的区域协同心血管病急救模式(以下简称"新模式")的急救效果.方法 随机选取2015年1月—2016年6月在该研究单位经新模式进行救治的180例胸痛患者作为观察组
<正>关于现代中国文学史的典型问题讨论,鲁迅《阿Q正传》及其创造的"阿Q"的代表性和经典意味,是毫无疑问的。它不仅是百年中国文学的经典之作,汗牛充栋的相关讨论也足以担当
设Hopf代数H余作用于代数A,本文讨论代数A,余不变子代数AcoH及Smash积A#H的相互关系,同时将研究Hopf模,全积分及除环的HopfGalois扩张。
目的构建携带大鼠白细胞介素-6(interleukin 6,IL-6)基因的重组腺病毒,为研究IL-6在神经损伤中的生物学作用提供技术手段。方法体外扩增大鼠IL-6基因,定向克隆到pAdTrace-TOX
埃利奥特·卡特(Elliott Carter,1908.12.11—2012.11.5)是美国当代著名作曲家,他的音乐风格以复杂性著称。他是一位大器晚成者,40岁以后才在国际舞台崭露头角,并坚持自己的
本文讨论了其同余是一致的,可换的以及主同余是可转移的Ocham代数Berman类。
应用于劳动就业中心的智能招聘系统是一个新型课题,系统包括智能招聘终端机和服务器,智能招聘终端机硬件部分基于ARM9设计,而软件部分以及服务器软件是基于.NET实现。文中对