连续时间总报酬马氏决策规划

来源 :科学通报 | 被引量 : 0次 | 上传用户：jintaijing

【摘要】

：

<正> 以期望总报酬为准则的连续时间马氏决策规划,自R.A.Bellman(1957),特别是Miller研究以来,已有一些文献报道。这些文献,就我们所知,都是从微分方程型的最优方程出发,给出

【作者】

：

宋京生董泽清

【机构】

：

中国科学院应用数学研究所; 中国科学院应用数学研究所北京; 北京;

【出处】

：

科学通报

【发表日期】

：

2004年期

【关键词】

：

最优策略马氏决策规划

【基金项目】

：

国家自然科学基金

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

<正> 以期望总报酬为准则的连续时间马氏决策规划,自R.A.Bellman(1957),特别是Miller研究以来,已有一些文献报道。这些文献,就我们所知,都是从微分方程型的最优方程出发,给出一个策略是最优的充要条件。这种条件是不便于验证的。本文对更广的模型,给出了一个策略是最优的新的充要条件(定理4和5),该条件颇为直观;并进一步探讨了最优

其他文献

福田戴姆勒与泰安航天战略合作欧曼再助航天梦

2014年1月12日，福田戴姆勒汽车携手泰安航天特种车有限公司，在山东泰安举办“助力航天梦携手共发展”战略合作签约仪式。

期刊

特种车物流运输

头孢呋辛联合炎琥宁治疗小儿支气管肺炎的临床疗效

目的探讨头孢呋辛联合炎琥宁治疗小儿支气管肺炎的临床疗效。方法将我院2010年4月—2012年4月收治的小儿支气管肺炎患儿100例,随机分为治疗组和对照组,各50例。治疗组在常规

期刊

头孢呋辛炎琥宁儿童支气管肺炎治疗结果

机器人柔顺抓放技术与应用

工件的柔性放置是工业机器人在进行装配任务时需要解决的一个基本问题。进行了基于工业机器人与六维力传感器的装配抓放过程力控原型系统的设计与实现。采用导纳控制算法使原

期刊

导纳控制六维力传感器工业机器人柔顺放置

知识产权司法保护与行政保护的协调与发展

本文介绍了知识产权司法保护和行政保护的含义、特点、保护措施及现状。要真正的建立有效、完善的具有可操作性的知识产权保护执法协作机制首先在司法保护中建立三审合一的知

期刊

知识产权司法保护行政保护协调发展

基于自适应空间滤波的EMD域静止卫星历史变轨检测

为了利用经验模式分解方法对具有扰动的卫星经度信号提取边缘信息,本文将经度信号的小幅扰动看作噪声,提出一种采用中位数绝对离差方法自适应估计空间滤波器阈值的EMD域多尺

会议

地球静止轨道卫星边缘提取经验模式分解空间滤波中位数绝对离差

甲状腺肿瘤普外科手术治疗临床护理要点探讨

目的：探讨甲状腺肿瘤普外科手术治疗临床护理要点。方法：选择80例甲状腺肿瘤行普外科手术治疗的患者，采用数字表抽取法随机分组，就常规护理（对照组）与围术期整体护理干预（观察组）预后

期刊

甲状腺肿瘤普外科手术临床护理要点

广西干旱灾害暴露度时空变化特征

利用2004-2015年广西干旱灾害的灾情数据和社会经济数据，从灾害发生的人口暴露度、农作物暴露度和经济暴露度3个方面分析干旱灾害暴露度的时空变化特征。结果表明，2004-2015年

期刊

人口暴露度经济暴露度旱灾时间变化空间特征广西

水资源报道的生态观

1962年,美国女科学家蕾切尔·卡森写了《寂静的春天》一书,后来被称为是人类环境危机的第一声警报。但在当年,这本书却遭到很多抨击和嘲弄。春天没有鸟鸣又如何呢?随着时光的

期刊

大型水电工程生态观杨柳湖水资源水电开发四川康定中央人民广播电台水电站生态文明生态补偿机制公共决策

重庆市黔江区农村老年高血压患者服药依从性现状及影响因素

目的：了解重庆市黔江区农村地区老年高血压患者服药依从性的现状并分析其影响因素，为提高患者服药依从性提供理论指导。方法：运用分层随机抽样的方法。对重庆市黔江N600名农村老

期刊

高血压服药依从性健康理念

浅析日语助词“は”、“が”与信息结构的关系

本文从系统功能语言学理论出发,分析了日语助词"は"、"が"与信息结构之间的关系。首先就已知信息与新信息的概念问题进行了界定,然后从"は""が"的功能出发,探讨了其与已知信

期刊

新信息已知信息“は”“が”

连续时间总报酬马氏决策规划

与本文相关的学术论文