论文部分内容阅读
随着科学技术的发展,工程控制系统的规模和复杂性不断增加,若设计控制器时不考虑一些不确定项可能导致整个系统性能下降,甚至影响系统稳定性,造成不可预期的损失.因此,提高控制系统的安全性和可靠性变得尤为重要.由于非线性系统本身的复杂性,其控制理论发展的并不完善,相应的非线性系统的控制方法也十分有限,而且多数现有结果主要研究系统稳定性问题,在此基础上的系统性能优化问题却很少被考虑.
自适应动态规划方法融合了神经网络、强化学习、自适应评价设计等思想,在应用于求解复杂系统的最优控制问题时可以避免动态规划算法中”维数灾难”问题.本文在自适应动态规划理论的基础研究上,结合最优控制、博弈论、以及滑模控制等理论,深入研究了非线性系统的最优跟踪问题以及几类连续不确定非线性系统的鲁棒控制问题,本文的主要工作如下:
(1)针对带有扰动的非线性多输入不确定系统,通过将鲁棒控制问题转化为多人非零和问题,并研究纳什平衡点的鲁棒特性,来构造不确定系统的控制策略.通过Lyapunov方法得到鲁棒控制策略存在的充分条件.对于纳什平衡点的求解,文中采用在线单网络ADP算法近似求解耦合HJ方程组来得到,算法的实现仅需要在线调整评价网络的权值.利用Lyapunov理论证明了闭环系统状态和神经网络的权值估计误差是一致最终有界的.
(2)首次将非线性大互联系统的分散跟踪问题转化为由误差系统和孤立子系统组成的时不变增广系统的最优控制问题,间接得到分散式自适应跟踪控制器.为求解非线性HJB方程,提出基于单神经网络的ADP算法,并且在线实时实现.通过在评价网权值更新律中加入一个辅助项,从而避免了初始容许控制这一严苛条件.利用Lyapunov理论证明了跟踪误差信号和神经网络权值误差是一致有界稳定的.
(3)针对一类带有饱和输入的不确定非线性系统,基于ISM理论和ADP方法,提出了一种新颖的滑模最优控制器.该控制器包含两个部分,其中不连续控制部分保证系统维持在滑模面上,而连续控制部分保证系统状态在滑模动态下沿最优轨迹运动.通过在性能指标函数内引入一个非二次泛函来处理饱和输入问题,并基于执行-评价神经网络架构,利用在线近似学习算法实现近似求解该饱和输入系统的HJB方程.同时,利用Lyapunov理论证明了闭环系统状态和神经网络的权值估计误差是一致最终有界的.
(4)结合滑模控制与非线性H∞最优控制理论,针对带有执行器故障和不匹配干扰的非线性系统,提出了一种新颖的复合控制策略.该复合控制策略包含两个部分,一部分是不连续滑模切换律,用于消除执行器故障和分离出的匹配扰动分量的影响,另一部分是非线性H∞最优控制,用于保证滑动模态下系统的稳定性.其中H∞控制器是基于执行网-评价网-扰动网架构的在线策略更新算法求解HJI方程来得到.最后,利用Lyapunov理论证明了闭环系统状态和神经网络的权值估计误差是一致最终有界的.
(5)针对一类带有控制约束的不确定非线性系统,基于ISM和ADP方法,设计了最优保性能滑模控制器.该控制器包含两个部分,其中不连续滑模切换律,保证系统状态维持在滑模面,而连续保性能控制,可保证滑动模态下的闭环系统稳定性及性能上界最小.提出单网络ADP算法来近似求解辅助系统的HJB方程,且算法的实现不需要初始容许控制.最后,利用Lyapunov理论证明了闭环系统状态和权值误差可保证是一致最终有界的.
自适应动态规划方法融合了神经网络、强化学习、自适应评价设计等思想,在应用于求解复杂系统的最优控制问题时可以避免动态规划算法中”维数灾难”问题.本文在自适应动态规划理论的基础研究上,结合最优控制、博弈论、以及滑模控制等理论,深入研究了非线性系统的最优跟踪问题以及几类连续不确定非线性系统的鲁棒控制问题,本文的主要工作如下:
(1)针对带有扰动的非线性多输入不确定系统,通过将鲁棒控制问题转化为多人非零和问题,并研究纳什平衡点的鲁棒特性,来构造不确定系统的控制策略.通过Lyapunov方法得到鲁棒控制策略存在的充分条件.对于纳什平衡点的求解,文中采用在线单网络ADP算法近似求解耦合HJ方程组来得到,算法的实现仅需要在线调整评价网络的权值.利用Lyapunov理论证明了闭环系统状态和神经网络的权值估计误差是一致最终有界的.
(2)首次将非线性大互联系统的分散跟踪问题转化为由误差系统和孤立子系统组成的时不变增广系统的最优控制问题,间接得到分散式自适应跟踪控制器.为求解非线性HJB方程,提出基于单神经网络的ADP算法,并且在线实时实现.通过在评价网权值更新律中加入一个辅助项,从而避免了初始容许控制这一严苛条件.利用Lyapunov理论证明了跟踪误差信号和神经网络权值误差是一致有界稳定的.
(3)针对一类带有饱和输入的不确定非线性系统,基于ISM理论和ADP方法,提出了一种新颖的滑模最优控制器.该控制器包含两个部分,其中不连续控制部分保证系统维持在滑模面上,而连续控制部分保证系统状态在滑模动态下沿最优轨迹运动.通过在性能指标函数内引入一个非二次泛函来处理饱和输入问题,并基于执行-评价神经网络架构,利用在线近似学习算法实现近似求解该饱和输入系统的HJB方程.同时,利用Lyapunov理论证明了闭环系统状态和神经网络的权值估计误差是一致最终有界的.
(4)结合滑模控制与非线性H∞最优控制理论,针对带有执行器故障和不匹配干扰的非线性系统,提出了一种新颖的复合控制策略.该复合控制策略包含两个部分,一部分是不连续滑模切换律,用于消除执行器故障和分离出的匹配扰动分量的影响,另一部分是非线性H∞最优控制,用于保证滑动模态下系统的稳定性.其中H∞控制器是基于执行网-评价网-扰动网架构的在线策略更新算法求解HJI方程来得到.最后,利用Lyapunov理论证明了闭环系统状态和神经网络的权值估计误差是一致最终有界的.
(5)针对一类带有控制约束的不确定非线性系统,基于ISM和ADP方法,设计了最优保性能滑模控制器.该控制器包含两个部分,其中不连续滑模切换律,保证系统状态维持在滑模面,而连续保性能控制,可保证滑动模态下的闭环系统稳定性及性能上界最小.提出单网络ADP算法来近似求解辅助系统的HJB方程,且算法的实现不需要初始容许控制.最后,利用Lyapunov理论证明了闭环系统状态和权值误差可保证是一致最终有界的.