多变量环境下基于递阶模糊神经网络的强化学习

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:valgrind2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多变量连续空间学习问题的复杂性,给出了一种采用递阶模糊神经网络(HFNN)的强化学习方法,两个结构相同的HFNN分别同时完成模糊动作的合成以及值函数的逼近,网络参数通过梯度下降法在线调整.该方法有效地解决了在多变量环境下所遇到的规则组合爆炸问题,减少了运算量和存储量.HFNN前一阶的输出不再作为下一阶的前件,而直接用于其结论部分,克服了前一阶输出含义不明确或没有含义所带来的设计问题.通过仿真二级倒立摆验证表明,所给出方法是正确可行的.
其他文献
经不同热轧终止温度生产的两种含Ti-Nb超低碳IF深冲钢薄板呈现不同的塑性各向异性.利用取向分布函数(ODF)定量分析了它们的织构,并对它们相异的塑性行为与织构及ODF级数展开
针对土工织物筋土接触面的软化和塑性流动现象,根据拉拔试验的结果,提出了剪应力-位移关系的三阶段弹塑性模型.由筋材的受力特性建立微分控制方程,并通过有限差分法进行求解,
以中和后的猪原皮为原料提取明胶,研究了蒸胶过程中温度、pH值、时间等因素对明胶冻力、下胶量、胶液浓度及胶液体积的影响,确定了提取高冻力明胶的最优参数。结果表明,温度57℃