论文部分内容阅读
随着科学技术的发展,工程控制系统的规模和复杂性不断增加,出现故障的机率也随之增大。任何类型故障的发生都可能导致整个系统性能下降,甚至影响系统稳定性,造成不可预期的损失。因此,提高控制系统的安全性和可靠性变得尤为重要,容错控制的出现和发展为解决这一问题提供了有效途径。考虑到实际工程系统几乎都是非线性系统,因此研究非线性系统的容错控制问题非常有意义。由于非线性系统本身的复杂性,其控制理论的发展并不完善,针对一般非线性系统的容错控制方法也相应地十分有限,而且多数现有结果主要研究故障系统稳定性问题,在此基础上的系统性能优化问题却很少被考虑。近些年来,基于神经网络近似的非线性系统控制方法受到广泛关注,神经网络学习方法的引入大大推动了非线性系统控制理论的发展。然而,许多现有的非线性系统控制方法主要针对具有特定结构的系统,相应的非线性系统容错控制问题的研究也大都具有这样的限制。
本论文基于自适应动态规划(Adaptive Dynamic Programming, ADP)方法,在最优控制以及微分对策理论的框架下,结合容错控制(Fault-tolerant Control, FTC)理论、自适应控制、反演控制、智能控制等现代控制方法,研究了非线性系统的自适应最优容错控制问题。进一步将单个非线性系统的最优容错控制问题拓展到多智能体系统的自适应最优协同容错控制问题上,并以无人机编队(Unmanned Aerial Vehicles, UAVs)为研究背景,研究一个或多个编队成员发生故障时的自适应优化协同容错控制方法。同时考虑在实际情况中可能出现的干扰问题,研究外界有界干扰下的UAVs微分对策最优协同容错控制算法。主要内容有:
(1)针对存在执行器故障的一类仿射非线性系统,基于自适应动态规划方法,提出了一种自适应最优容错控制方案。首先设计一种特殊的自适应机制来估计故障参数,利用估计的故障信息构建一个改进型的性能指标函数,将非线性容错控制问题转化为最优控制问题。在此基础上,基于ADP方法,使用策略迭代(policy iteration,PI)算法,仅仅通过构造评价神经网络来近似耦合哈密顿–雅克比–贝尔曼(Hamilton-Jacobi-Bellman, HJB)方程,进而获得近似最优容错控制律,而不在依赖于评价-执行双层神经网络结构。
(2)针对存在执行器故障的一类严格反馈型非线性系统,基于反演控制技术和自适应动态规划方法,提出前馈容错控制+反馈最优控制结构方案。首先,基于反演控制技术,通过引入辅助动态系统和李雅普诺夫函数,有效处理执行器的故障问题,将原系统的容错控制问题转化为等效跟踪误差动态系统的最优调节控制问题;而后,基于自适应规划设计了反馈型最优控制器。所设计的故障估计和控制算法参数在线更新,控制系统具有自适应故障补偿能力,以便响应故障指示实时重新配置控制规律。
(3)针对领机-僚机协同方式的无人机编队,考虑无人机出现执行器故障的情形,提出了分布式自适应最优协同容错控制方案。所提出的控制器可分为两部分:(1)无故障系统的最优协同控制策略和(2)故障补偿器。首先,为每架无人机设计单网络结构来近似耦合哈密顿-雅克比(Hamilton-Jacobi, HJ)方程的解,进而求得分布式最优协同控制律。随后,通过推导一种特殊的故障补偿器以消除执行器故障的影响。整个控制器不仅保证了无人机系统中的所有信号最终一致有界,而且保证了协同代价函数的最小化。对于无人机的编队系统,使用单网络而不是自适应动态规划典型的双网结构优势更加突出,因为这样不但可以减少对无人机的内存需求还可以减少计算负担。
(4)考虑在实际情况中可能存在外界扰动的因素,研究外界扰动下编队系统的分布式微分对策最优协同容错控制方案。首先在微分对策理论的框架下,基于图论和一致性理论,通过建立无故障情况下的一致性误差动态方程,将无人机编队抗干扰问题描述为一类非线性系统的最优控制问题,推导出外界干扰条件下的微分对策自适应协同控制策略;然后通过建立补偿控制器达到容错控制的目的;最后通过构建单层时变评价网络结构在线逼近时变优代价函数;最后,基于Lyapunov稳定性理论,证明了闭环系统内所有信号的有界性。
本论文基于自适应动态规划(Adaptive Dynamic Programming, ADP)方法,在最优控制以及微分对策理论的框架下,结合容错控制(Fault-tolerant Control, FTC)理论、自适应控制、反演控制、智能控制等现代控制方法,研究了非线性系统的自适应最优容错控制问题。进一步将单个非线性系统的最优容错控制问题拓展到多智能体系统的自适应最优协同容错控制问题上,并以无人机编队(Unmanned Aerial Vehicles, UAVs)为研究背景,研究一个或多个编队成员发生故障时的自适应优化协同容错控制方法。同时考虑在实际情况中可能出现的干扰问题,研究外界有界干扰下的UAVs微分对策最优协同容错控制算法。主要内容有:
(1)针对存在执行器故障的一类仿射非线性系统,基于自适应动态规划方法,提出了一种自适应最优容错控制方案。首先设计一种特殊的自适应机制来估计故障参数,利用估计的故障信息构建一个改进型的性能指标函数,将非线性容错控制问题转化为最优控制问题。在此基础上,基于ADP方法,使用策略迭代(policy iteration,PI)算法,仅仅通过构造评价神经网络来近似耦合哈密顿–雅克比–贝尔曼(Hamilton-Jacobi-Bellman, HJB)方程,进而获得近似最优容错控制律,而不在依赖于评价-执行双层神经网络结构。
(2)针对存在执行器故障的一类严格反馈型非线性系统,基于反演控制技术和自适应动态规划方法,提出前馈容错控制+反馈最优控制结构方案。首先,基于反演控制技术,通过引入辅助动态系统和李雅普诺夫函数,有效处理执行器的故障问题,将原系统的容错控制问题转化为等效跟踪误差动态系统的最优调节控制问题;而后,基于自适应规划设计了反馈型最优控制器。所设计的故障估计和控制算法参数在线更新,控制系统具有自适应故障补偿能力,以便响应故障指示实时重新配置控制规律。
(3)针对领机-僚机协同方式的无人机编队,考虑无人机出现执行器故障的情形,提出了分布式自适应最优协同容错控制方案。所提出的控制器可分为两部分:(1)无故障系统的最优协同控制策略和(2)故障补偿器。首先,为每架无人机设计单网络结构来近似耦合哈密顿-雅克比(Hamilton-Jacobi, HJ)方程的解,进而求得分布式最优协同控制律。随后,通过推导一种特殊的故障补偿器以消除执行器故障的影响。整个控制器不仅保证了无人机系统中的所有信号最终一致有界,而且保证了协同代价函数的最小化。对于无人机的编队系统,使用单网络而不是自适应动态规划典型的双网结构优势更加突出,因为这样不但可以减少对无人机的内存需求还可以减少计算负担。
(4)考虑在实际情况中可能存在外界扰动的因素,研究外界扰动下编队系统的分布式微分对策最优协同容错控制方案。首先在微分对策理论的框架下,基于图论和一致性理论,通过建立无故障情况下的一致性误差动态方程,将无人机编队抗干扰问题描述为一类非线性系统的最优控制问题,推导出外界干扰条件下的微分对策自适应协同控制策略;然后通过建立补偿控制器达到容错控制的目的;最后通过构建单层时变评价网络结构在线逼近时变优代价函数;最后,基于Lyapunov稳定性理论,证明了闭环系统内所有信号的有界性。