在概率阈值准则下马尔可夫策略的最优化算法

来源 :山东理工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:zhang_ts
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在一种新的概率阈值准则下讨论马尔可夫决策的最优解的算法问题.采用基于增益的过去累积值的方法,求解马尔可夫最优策略.
其他文献
中日两国一衣带水,高等教育交流自古不断,隋唐时期,日本曾向中国派出大量使节及留学生来华学习,并于八世纪初仿照唐朝的国子监在日本设立了古代的大学--大学寮,在很长一段时
阐述了新建本科院英语师资队伍现状,分析了造成学校英师资队伍当前状况的原因,指出加强英语师资队伍建设的途径。
随着世界经济一体化趋势的日益加深,跨国公司经营成为一种越来越普遍的经营方式。这种经营可以突破国家或民族的界限,在全世界范围内充分调动尽可能多的人力、物力、财力,实现资
从设计、安装和设备本身的缺陷等方面分析了GIS设备中SF6气体泄漏的主要原因,并根据不同情况有针对性地提出了预防措施。