连续时间总报酬马氏决策规划

来源 :科学通报 | 被引量 : 0次 | 上传用户:jintaijing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
<正> 以期望总报酬为准则的连续时间马氏决策规划,自R.A.Bellman(1957),特别是Miller研究以来,已有一些文献报道。这些文献,就我们所知,都是从微分方程型的最优方程出发,给出一个策略是最优的充要条件。这种条件是不便于验证的。本文对更广的模型,给出了一个策略是最优的新的充要条件(定理4和5),该条件颇为直观;并进一步探讨了最优
其他文献
2014年1月12日,福田戴姆勒汽车携手泰安航天特种车有限公司,在山东泰安举办“助力航天梦携手共发展”战略合作签约仪式。
目的探讨头孢呋辛联合炎琥宁治疗小儿支气管肺炎的临床疗效。方法将我院2010年4月—2012年4月收治的小儿支气管肺炎患儿100例,随机分为治疗组和对照组,各50例。治疗组在常规
工件的柔性放置是工业机器人在进行装配任务时需要解决的一个基本问题。进行了基于工业机器人与六维力传感器的装配抓放过程力控原型系统的设计与实现。采用导纳控制算法使原
本文介绍了知识产权司法保护和行政保护的含义、特点、保护措施及现状。要真正的建立有效、完善的具有可操作性的知识产权保护执法协作机制首先在司法保护中建立三审合一的知
为了利用经验模式分解方法对具有扰动的卫星经度信号提取边缘信息,本文将经度信号的小幅扰动看作噪声,提出一种采用中位数绝对离差方法自适应估计空间滤波器阈值的EMD域多尺
目的:探讨甲状腺肿瘤普外科手术治疗临床护理要点。方法:选择80例甲状腺肿瘤行普外科手术治疗的患者,采用数字表抽取法随机分组,就常规护理(对照组)与围术期整体护理干预(观察组)预后
利用2004-2015年广西干旱灾害的灾情数据和社会经济数据,从灾害发生的人口暴露度、农作物暴露度和经济暴露度3个方面分析干旱灾害暴露度的时空变化特征。结果表明,2004-2015年
1962年,美国女科学家蕾切尔·卡森写了《寂静的春天》一书,后来被称为是人类环境危机的第一声警报。但在当年,这本书却遭到很多抨击和嘲弄。春天没有鸟鸣又如何呢?随着时光的
目的:了解重庆市黔江区农村地区老年高血压患者服药依从性的现状并分析其影响因素,为提高患者服药依从性提供理论指导。方法:运用分层随机抽样的方法。对重庆市黔江N600名农村老
本文从系统功能语言学理论出发,分析了日语助词"は"、"が"与信息结构之间的关系。首先就已知信息与新信息的概念问题进行了界定,然后从"は""が"的功能出发,探讨了其与已知信