基于动态规划的学习方法

来源 :系统工程理论方法应用 | 被引量 : 0次 | 上传用户:falconcarmack
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文综述了最新发展的基于动态规划的学习方法,介绍了这些方法的基本思想和特点,与动态规划,启发式搜索和再励学习间的关系,并讨论其计算杂性和收敛速度,最后,展望且了这些方法的发展和应用前景。
其他文献
本文针对价格系统性建立了基本价格系统模型,给出了定价稳定性的充要条件,给了同了临界平均毛利率,并在经济意义上作了简短的讨论,揭示了价格稳定的“系统本质属性”。
本文讨论交联社会经济大系统稳态的存在性及生稳态的机理和特征。
本文首先提出了一种实现连续映射的三层感知器的构造方法,该方法对陷入局部极小点的多层感知器,可以补偿到全局最小点。然后,给出了一种可对上述三层感知器进行压缩的隐节点
Konno-Suzuki模型是证券组合优化均值方差模型的一个新的近似模型。H.Konno和K.Suzuki给出了一种近似算法。他们的近似解法有两个理论问题有待回答:①近似值与最优值的关系如
系统互程不是今天才有的,早在人类从事生产活动开始已有雏形,只是十分粗放地存在着。随着科学技术的发展,社会互程的进步,到了20世纪中期,才成为一门新的科学被人们所提出和
关于价格稳定性,多种产品和服务具有各别的临界系数,从而形成一个临界向量。本文给出了价格系统稳定性临界向量的定量表达式。
迎接系统工程学科体系成长发展期中的第二次浪潮王浣尘(上海交通大学系统工程研究所200052)我国社会经济飞速发展,正从长期的社会主义计划经济向社会主义市场经济转变,正从“发展中”水
本文简述了浑沌理论的一些基本概念和常用的研究方法,并初步探讨了它在非线性经济学中的应用。
针对CIMS建造中主要障碍来自人的因素这一现状,本文首先提出应该建造以人为中心的CIMS,接着作者分析了它的含义,好处及主要内容,然后详细地讨论了它的设计和评价问题。自适应人机界面的设