论文部分内容阅读
神经元控制是应用人工神经网络模拟人和动物控制行为的一种控制方法。人工神经网络所具有的信息分布并行处理机制、逼近非线性映射的特性以及自适应的能力,使神经元控制的理论和方法得到了迅速发展,并成为智能控制理论和方法的重要组成部份。递归神经网络(RecurrentNeuralNetwork,RNN)是一种动态的神经计算模型,具有良好的优化计算功能,可用于最优控制。本研究致力于设计基于RNN的动态最优控制器,实现多变量时变系统实时递归的线性二次型(LinearQuadratic,LQ)闭环最优控制。论文取得了以下主要研究成果:
(1)基于Hopfield网络的动态优化求解器论文首先将离散Hopfield网络(DiscreteHopfieldNetwork,DHN)用作动态优化问题的求解器(DOSDHN),求解线性多变量时变系统有限域LQ最优控制问题。针对LQ状态最优和跟踪最优控制问题,分别给出了DOSDiN参数的设计过程及其整定方法。理论分析表明,基于该方法设计的DOSDHN具有稳定性,其稳态输出即代表多变量时变系统有限域LQ最优控制问题的解。其次,为了减小求解器的网络规模并提高其运算速度,论文进一步研究了应用模拟Hopfield网络(ContinuousHopfieldNetwork,CHN)求解上述最优控制问题的动态优化求解器(DOSCHN)的设计方法。理论设计过程表明,合理选取CHN元件参数和神经元非线性特性时,基于该方法可得到稳定的DOSCHN,其稳态输出就是对应的LQ状态最优或跟踪最优控制问题的解。仿真结果验证了设计方法的有效性。
(2)基于Hopfield网络的闭环LQ最优控制系统设计方法论文将有限时域上的LQ动态最优控制问题求解器DOSDHN和DOSCHN的设计方法进一步推广到移动时域上,相应地得到了可以在线构造和实时递归求解多变量时变系统LQ最优控制问题的最优控制器OCDHN和OCCHN,并给出了包括OCDHN或OCCHN在内的最优反馈控制系统的结构设计。理论分析和实验研究表明,当移动时域终端加权矩阵选取适当时,能够确保基于OCDHN或OCCHN的闭环LQ最优控制系统具有稳定性,从而使多变量时变系统的闭环LQ状态最优或跟踪最优控制问题得以实现。
(3)一种改进的Hopfield网络及在LQ最优控制中的应用研究论文在对差分式Hopfield网络和离散时间连续状态Hopfield网络的工作特性进行研究的基础上,创建了一种时间离散而状态连续的改进的Hopfield网络(ModifiedHopfieldNetwork,MHN)。理论分析证明,MHN作为一种迭代学习系统,当其具有负定联结权矩阵和足够小的网络学习率时,在全并行模式下将具有全局稳定性,在其惟一的平衡点处其能量函数达到全局极小值。这一特点,使MHN具有神经优化计算功能。当MHN用于二次优化计算时,它保持了与CHN一样小的网络规模,并避免了DHN和CHN可能的局部极小问题,从而获得了优化问题的精确解。在此基础上,论文基于MHN稳定性与能量函数收敛特性间的关系,设计了分别用于求解多变量时变系统有限时域LQ状态最优和跟踪最优控制问题的求解器(DOSMHN),并将之进一步推广到无限时域,相应得到了可以在线设计和求解的最优控制器(OCMHN)。理论分析和实验研究表明,基于OCMHN的最优控制系统具有一致渐近稳定性,能够实现无限时域LQ状态最优和跟踪最优控制。
论文的研究工作得到了国家自然基金(NO.60375017)、教育部科学技术研究重点项目(NO.203002)的资助,论文所取得的研究成果将对神经元控制及智能控制理论的研究与发展产生积极的意义。