非平稳MDP—平均样本轨道最优

来源 :数学物理学报 | 被引量 : 0次 | 上传用户:zhaomingze2631539
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作者考虑的是任意状态空间,任意行动空间非平稳MDP的平均样本轨道目标.在弱遍历条件下,用鞅的极限理论,证明了最优马氏策略的存在性,推广了A.Arapostathis,V.Borkar,E.F.Gaucherand,M.Ghosh,S.Marcus[1](1993)的主要结果.
其他文献
针对深圳南山热电厂污泥干化工程中温污泥带式干化过程中可能存在的粉尘和气体爆炸问题,结合欧盟关于生产防爆管理法律与规范,提出深圳南山热电厂污泥干化工程设计中必须关注