基于策略迭代和遗传算法的SMDP鲁棒控制策略求解

来源 :合肥工业大学学报(自然科学版) | 被引量 : 0次 | 上传用户:gaylene
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半马尔可夫决策过程(SMDP)描述的一类受控半Markov系统,其模型参数在实际中常常不确定或不可知,可能导致随机过程的性能函数和系统参数(即嵌入链转移概率和状态逗留时间分布)皆不确定。该文针对参数不相关的情况,给出求解鲁棒控制策略的迭代算法,并在迭代过程中引入遗传算法,以提高全局优化能力。数值例子表明,基于遗传算法的策略迭代应用于鲁棒决策问题中具有较好的优化效果。
其他文献
美国大豆协会国际项目与重庆万州区水产技术推广站合作在重庆万州开展了两项网箱养殖试验,以评估在新建的三峡水库进行小体积高密度网箱养殖鲤鱼的技术和经济可行性。三峡水库
文章采用GARCH模型和SV模型对深圳股市进行了实证分析;结果表明,基本SV模型较GARCH(1,1)模型能更好地拟合实际金融时间序列数据;从总体上来说,基本SV模型的预测效果优于GARCH(1,1)模
文章针对制造现场资源种类和数量的急剧增多,并且管理层对车间现场资源的管理和控制处于黑箱式作业的问题,在深入分析和研究制造现场实时资源追踪的功能需求基础上,提出了基于状态码的实时资源追踪思想,重点研究了制造资源状态码的构建和控制,并通过实例验证了上述状态码的可行性和优越性。