论文部分内容阅读
由于多智能体系统在各实际领域中都具有十分广泛的应用,协调控制作为多智能体系统研究的一个重要分支受到了普遍关注。多智能体分布式同步控制是协调控制的一个基本研究方向。同步控制是指以网络作为智能体之间信息交流的通信媒介,通过设计控制器或控制协议,实现各智能体行为一致。现有相关研究更多地针对简单动力学模型的多智能体系统,比如单或双积分器。而且,其控制协议的设计依赖于系统动力学模型。然而,实际多智能体系统往往是复杂非线性系统,包括外界扰动与系统动力学模型未知。另外,在实际中也要求多智能体系统具有柔性协作能力和最优系统性能。以上实际情况引起耦合Bellman方程求解困难的问题,导致难以实现非线性多智能体系统的分布式同步控制,因而大大限制了多智能体系统在复杂环境下的应用。为此,基于自适应评价设计(Adaptive critic designs,ACDs)的自学习特点,本文展开基于ACDs的复杂非线性多智能体系统分布式同步控制研究。本文的主要研究内容概括如下。(1)模型未知单输入非线性系统的模型参考自适应评价学习控制针对具有持续扰动的模型未知单输入非线性系统,为解决模型参考自适应控制中由ACDs引入的神经网络逼近误差问题,提出模型参考自适应评价学习(Model reference adaptive critic learning,MRACL)控制方法,实现非线性系统在线实时柔性跟踪参考模型行为,同时保证闭环控制系统最优控制性能。同时,该方法也可保证无抖振滑模控制的可实施性,进而实现对逼近误差与扰动的抑制。(2)模型完全未知多输入非线性系统的监督模型参考自适应评价学习控制在模型参考自适应评价学习控制方法的基础上,针对多输入非线性系统,在不要求有界系统漂移动力学的假设下,通过引入监督器到模型参考自适应评价学习控制,研究了监督模型参考自适应评价学习控制方法,并定义了学习模式和控制模式。引入的监督器不仅可以指导执行-评价网络的学习,而且也可以产生无抖振滑模控制量,解决了模型未知多输入非线性系统持续扰动和神经网络逼近误差的鲁棒性问题。(3)模型部分未知非线性多智能体系统最优同步控制针对模型部分未知的非线性多智能体系统,局部邻域跟踪误差动力学引入了邻居智能体状态,导致耦合Bellman方程求解更为困难,这是最优同步控制协议设计的关键难点。针对这一问题,本文构造了一种分层分布式最优同步控制结构。在分散式模型参考控制层采用神经网络自适应控制方法,实现各个智能体跟踪相应的参考模型行为;在分布式最优同步控制层中,以各参考模型和领导者为个体构建参考多智能体系统,研究了分布式值迭代学习方式,并提出了分布式模型参考自适应评价学习同步控制方法,使参考多智能体系统达到Nash均衡,保证所有参考模型行为一致,实现多智能体系统最优同步控制。(4)模型完全未知非线性多智能体系统最优同步控制针对非线性多智能体系统动力学模型完全未知的情况,构建了基于无模型分布式模型参考自适应评价学习的分层分布式最优同步控制结构。在分散式模型参考控制层,为了降低最优同步控制的计算量,设计了一种类离线神经网络自适应控制器;在分布式最优同步控制层中,提出了分布式参考策略迭代学习方式,获得具有复合函数的耦合Bellman非线性方程的Nash均衡解,并发展了无模型分布式模型参考自适应评价学习同步控制方法,在不利用系统模型先验知识下,保证多智能体系统达到最优同步。(5)具有激活领导者的多智能体系统最优同步控制针对具有外界扰动的激活领导者系统,构建了基于分布式监督模型参考自适应评价学习的分层分布式最优同步控制结构。在分散式模型参考控制层,采用所提的监督模型参考自适应评价学习控制方法,实现对外界扰动和逼近误差的抑制;在分布式最优同步控制层中,以各参考模型为个体构建参考多智能体系统,发展分布式监督模型参考自适应评价学习同步控制方法,使得参考多智能体系统达到Nash均衡,实现多智能体系统的最优同步控制,并保证多智能体系统的柔性协作能力。