多变量环境下基于递阶模糊神经网络的强化学习

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户：valgrind2

【摘要】

：

针对多变量连续空间学习问题的复杂性,给出了一种采用递阶模糊神经网络(HFNN)的强化学习方法,两个结构相同的HFNN分别同时完成模糊动作的合成以及值函数的逼近,网络参数通过

【作者】

：

张文志吕恬生王乐天

【机构】

：

上海交通大学

【出处】

：

上海交通大学学报

【发表日期】

：

2004年9期

【关键词】

：

模糊系统递阶模糊神经网络强化学习二级倒立摆 Computer simulation Fuzzy control Hierarchical systems

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对多变量连续空间学习问题的复杂性,给出了一种采用递阶模糊神经网络(HFNN)的强化学习方法,两个结构相同的HFNN分别同时完成模糊动作的合成以及值函数的逼近,网络参数通过梯度下降法在线调整.该方法有效地解决了在多变量环境下所遇到的规则组合爆炸问题,减少了运算量和存储量.HFNN前一阶的输出不再作为下一阶的前件,而直接用于其结论部分,克服了前一阶输出含义不明确或没有含义所带来的设计问题.通过仿真二级倒立摆验证表明,所给出方法是正确可行的.

其他文献

IF深冲钢织构及其对塑性各向异性的影响

经不同热轧终止温度生产的两种含Ti-Nb超低碳IF深冲钢薄板呈现不同的塑性各向异性.利用取向分布函数(ODF)定量分析了它们的织构,并对它们相异的塑性行为与织构及ODF级数展开

期刊

IF深冲钢塑性各向异性织构取向分布函数Alloying elementsAnisotropyHot rollingNiobium alloysP

土工织物拉拔试验中筋土界面力学特性

针对土工织物筋土接触面的软化和塑性流动现象,根据拉拔试验的结果,提出了剪应力-位移关系的三阶段弹塑性模型.由筋材的受力特性建立微分控制方程,并通过有限差分法进行求解,

期刊

土工学土工织物拉拔试验弹塑性模型应变软化有限差分法Difference equationsFinite difference methodGeo

明胶冻力影响因素的研究

以中和后的猪原皮为原料提取明胶，研究了蒸胶过程中温度、pH值、时间等因素对明胶冻力、下胶量、胶液浓度及胶液体积的影响，确定了提取高冻力明胶的最优参数。结果表明，温度57℃

期刊

明胶冻力下胶量gelatin gel strength quantity of gelatin

多变量环境下基于递阶模糊神经网络的强化学习

其他学术论文