报酬无界的平均准则马氏决策过程

来源 :运筹学学报 | 被引量 : 0次 | 上传用户:alanlee75
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对可数状态集、非空决策集、报酬无界的平均准则马氏决策过程,提出了一组新的条件,在此条件下存在(ε)最优平稳策略,且当最优不等式中的和有定义时最优不等式也成立.
其他文献
<正> 善恶报应是我国民间一种信仰极普遍的思想观念。它上源蒙昧之远古,下迄文明之现代,从未或止。在赵宋统治的三百二十年间,尤其泛滥,堪称这一观念发展之高潮。对这样一种
<正>质能方程是原子物理中的重要内容,也是高考中的热点问题。但是有的学生由于理解不全面,对此的理解存在一些误区。现将其列出,与大家共同探讨。误区一质量亏损说明质量不
本文介绍类比合成(AC)算法及其对预测的应用.该途径属于多维模式搜索法,可用于预测最模糊的对象.它自选择若干与已知参考模式相似的模式并利用其延拓建立参考模式的一个预测.
<正>播音员的声音是电视广告中的一个重要的组成部分。除了画面,播音不仅是受众获得信息的重要渠道,也是辅助画面的重要手段,所以有人把播音称为广播电视广告的灵魂,是一则广
非市场因素对企业的影响越来越大,是企业寻求竞争优势的一种新趋势。以企业生命周期阶段为视角,分析不同生命周期阶段的特点,结合不同时期非市场策略的特征,提出不同生命周期
Tutte在1946年构造性证明了并非每个简单的3-凸胞腔都是Hamiltonian的后,人们又陆续提出了多种构造三次3-连通非Hamiltonian平面图的方法,但无一能用于在一般曲面上寻找三次3-
陶渊明用近似田家语的真朴语言,选取与自我心境相统一的景与事入诗,结合自己体悟的生活哲理,做到情景理高度融合。陶诗风格的冲淡并非平乏无奇,而是理蕴悠长、理意丰厚。
网络直播的诞生一方面延展了媒介时间、空间维度,使时间及空间边界更趋弱化;而另一方面,网络直播也成为用户媒介使用的"新规范",重塑了用户空间、时间的日常支配规则,同时从
为了使结构或构件能够更好地承受住泥石流、爆炸等冲击荷载,设计出一种新型带弹簧的支撑(件)。运用显式动力分析方法,对冲击载荷作用下的这种支撑进行数值模拟,计算得到新型
<正>第七期"热点评析"栏目谈了肿瘤细胞本身的免疫学特性[1],说明肿瘤细胞具有"免疫逃逸功能",不受患者体内免疫系统的监督。这仅说明肿瘤免疫耐受的一个方面,更为重要的是患