折扣准则下的CTMDP最优方程

被引量 : 0次 | 上传用户：zhiyuanxu

【摘要】

：

连续时间的马尔可夫决策模型在实际工作中有着极其广泛的应用。马尔可夫决策最优策略的确定很大程度上取决于决策准则的选取。平均报酬准则和折扣报酬准则是连续时间马尔可夫

【作者】

：

李婧

【发表日期】

：

2009年期

【关键词】

：

连续时间马尔可夫决策过程最优方程最优策略最优策略性质应用分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

连续时间的马尔可夫决策模型在实际工作中有着极其广泛的应用。马尔可夫决策最优策略的确定很大程度上取决于决策准则的选取。平均报酬准则和折扣报酬准则是连续时间马尔可夫决策最常用的两个准则。由于现在文献对于平均准则下的马尔可夫决策问题的关注,使得对于折扣准则下的连续时间马尔可夫问题的讨论显得不够完善。论文针对这一问题进行研究,填补了折扣准则下的连续时间马尔可夫决策问题在最优化条件的确定、最优方程的建立以及最优策略性质等方面的研究空缺,同时为人们在一些不确定的序列决策问题中做决策提供依据。论文讨论了在一般的状态空间和行动空间中,当转移率和报酬率无界时,连续时间马尔可夫决策过程的α—折扣报酬最优问题。主要进行了以下工作:①作为最优方程存在的前提,首先给出最优化条件。主要包括针对系统历史数据提出的三个假设,以及由此推出的两条引理,并给予了相应的证明。②在最优化条件被证明合理的前提下,论文建立了一个连续时间马尔可夫决策折扣报酬最优方程并证明了其存在性,同时在证明过程中说明了存在一个相应的折扣报酬最优平稳策略。论文用以证明方程存在性和寻找最优策略的策略迭代算法是基于三个对系统历史数据的假设条件的,从而取消了对于系统报酬值函数相关差分的假设以尽可能保留数据真实性。③为了使得策略的选择能够在决策过程中避免随机性影响,减小其随时间波动的不稳定性,在给定的最优化条件下,论文确定了ε—折扣最优平稳策略的存在,探讨了α—折扣报酬最优平稳策略的特殊性质。④最后,文章分析了连续时间马尔可夫决策过程折扣报酬最优方程的应用。选取电子商务平台问题做具体分析,然后针对其他方面的应用,对模型建立的原则,问题的实质等做了简单的阐述,说明将折扣报酬准则下的最优方程用以解决这一类问题是行之有效的。

其他文献

酒逢知己千杯少——熟语视阈下的“酒”文化探析

<正>在浩如烟海的熟语中与"酒"有关的熟语比比皆是,妇孺皆知,形成了一类别具一格的、成系统的"酒"文化熟语。语言是文化的载体,是文化的"活化石",熟语又是语言的精品,通过对"

期刊

中国酒文化审美心态文化探析

子宫肌瘤肉瘤变的治疗体会

目的:分析继发性子宫平滑肌肉瘤误诊的常见原因,总结继发性子宫平滑肌肉瘤的诊疗方法。方法:对我院妇科2012年6至8月间收治的3例继发性子宫平滑肌肉瘤的诊断治疗进行分析。结

期刊

子宫肌瘤肉瘤变子宫平滑肌肉瘤

马背上的优雅时尚——解析骑马装的演变历史

<正>骑马装是伴随着马术运动诞生而出现的一类专用服饰,迄今已有数百年的历史。随着马术爱好者的逐渐扩大,赛马场上的着装发生了变化,甚至还与时尚玩起了跨界。

期刊

马术运动马术比赛时装设计师利普斯女权运动演变历史

亚洲与全球卫生治理

全球化使各国联系日益密切,相互依赖加深。卫生问题已经不再是一国内部事务,一地疾病的暴发很可能会迅速发展成为全球卫生威胁并对邻国安全构成挑战。为了应对全球卫生挑战所

期刊

亚洲卫生问题卫生挑战全球卫生治理

我国国际贸易中的知识产权保护策略

加强国际贸易中的知识产权保护问题研究,是促进我国国际贸易健康发展、在国际贸易舞台上占据有利地位的现实需要,也是不断完善知识产权保护制度、促进经济健康可持续发展的需

期刊

国际贸易知识产权保护策略

生活化的艺术教育有利于促进幼儿个性发展

从幼儿一日活动的各个环节切入,走进幼儿的生活,开展赋有艺术性的生活活动,激发幼儿主动参与艺术活动,形成良好的个性品质。

期刊

幼儿艺术教育一日活动个性发展

端午节的文化精神与文化保护

端午节的文化精神主要包括遵从自然律令与应对灾异的生活智慧,忧国恤民、舍身赴难的爱国精神和正直峻洁、刚正不阿的人格风范等主要精神。这些精神凝聚了中华民族的理想与智

期刊

端午节文化精神文化保护

山东无棣清理一座东汉墓

<正> 1977年,山东省无棣县文化馆在配合农田水利基本建设工程时,经上级文物主管部门批准,清理了一座东汉时期墓葬。现将情况介绍如下。一、墓葬概况及墓室结构墓葬位于无棣县

期刊

东汉墓模印花纹楔形砖素面砖

选举抑或协商:对两种乡镇民主模式的比较分析

学界对中国应该实行选举民主还是协商民主一直存有争议,但尚未发现对其政治后果进行实证的比较研究。本文通过对乡镇层级出现的选举民主和协商民主创新试验进行实证分析,试图

期刊

选举民主协商民主乡镇政治后果

徐州市东郊陶楼汉墓清理简报

<正> 1989年10月,徐州市郊区下淀乡陶楼村采石场在开山采石时发现两座墓葬,徐州博物馆闻讯前往征集了全部出土遗物,并对两墓进行了清理。墓葬编号为XTM1和XTM2。1990年11月,

期刊

清理简报随葬品竖穴墓徐州市

折扣准则下的CTMDP最优方程

与本文相关的学术论文