论文部分内容阅读
最优控制问题广泛存在于实际生产生活中的各个方面。因实际中的控制系统大多是非线性系统,所以,使用经典控制理论来解决这类问题存在局限性。自适应动态规划方法(Adaptive Dynamic Programming,ADP)融合了动态规划、强化学习和人工神经网络的思想,为解决非线性系统的最优控制问题提供了新途径。在自适应动态规划方法的基础上,结合事件触发控制方法,本文对事件触发自适应动态规划方法(Event-Triggered Adaptive Dynami c Programming,ETADP)进行了研究。本文的主要工作如下:(1)针对模型未知非线性系统的最优控制问题,本文提出了一种新的事件触发启发式动态规划算法,提出了事件触发条件组,并证明了系统的稳定性。该算法减少了现有算法对假设条件的依赖。(2)针对仿射非线性系统的最优跟踪控制问题,根据事件触发机制所作用的控制器的不同,本文提出了两种事件触发自适应动态规划最优跟踪控制算法,设计了两种事件触发机制,并证明了控制系统能够准确跟踪期望轨迹。(3)针对涉及多控制器的非零和博弈问题,本文提出了多事件触发自适应动态规划算法,并为每个控制器单独设计了事件触发条件组。该算法在保证系统稳定性的同时,也保证了各个控制器的触发独立性。(4)针对零和博弈问题,本文设计了多事件触发自适应动态规划算法。该算法中,每个控制器的事件都与另一个控制器的控制策略相关。该算法能够使得系统状态稳定,并且能够保证控制器的触发独立性。本文所提出算法的基本结构都是执行-评价结构,通过人工神经网络实现:使用评价网络近似值函数;使用执行网络近似控制策略;对于模型未知的系统,使用模型网络近似系统动态模型。针对每个研究的问题和提出的算法,本文都给出了系统稳定性分析,并用仿真实验验证了算法的有效性。理论研究和仿真实验的结果表明事件触发自适应动态规划方法不但具有自适应动态规划方法的自学习能力,而且能够减少对数据量的需求,节省计算和存储空间,节约通信成本,从而为解决实际生产生活中的最优控制问题提供了理论基础。