论文部分内容阅读
本文在“领导者-跟随者”的框架下,着眼于具有同质与异质两类高阶线性系统动态的多智能体系统的分布式跟踪控制。当跟随者受到外界的干扰作用时,如何设计控制策略保证跟随者很好地跟踪领导者,是本文关心的第一个问题;当存在多个领导者时,智能体之间以什么样的方式进行通讯,可以保证跟随者最终包含在多个领导者形成的凸包内,是本文关心的第二个问题;当智能体之间存在的不仅仅是吸引作用,而同时具有排斥作用时,最终会表现出什么样的群体行为,是本文关心的第三个问题。 相比已有研究成果,本文就这三个问题分别取得了如下成果: 1.研究了受外界干扰的线性多智能体系统的最优跟踪问题。区别于已有的方法,本文以新的视角看待外界扰动,结合分布式控制、最优控制理论和微分博弈理论把上述最优跟踪问题转化成一个基于通讯拓扑的多玩家零和微分博弈问题。在该博弈问题中,误差系统的动态和性能指标不仅依赖于其邻居智能体的动态,同时也受到来自邻居的干扰。通过研究发现求解该博弈问题需要求解相应的有耦合关联的Hamilton-Jacobi-Isaacs(HJI)方程,而为了求解这些耦合关联的HJI方程,给出了策略迭代学习算法,并证明了该算法的收敛性。利用所提出的方法证明了相应的跟踪误差是L2有界的。与此同时,给出了一个在线策略迭代算法来求解相应的零和博弈问题,并提供了一个数值算例验证了在线迭代算法的有效性。 2.研究了受外界干扰的同质与异质线性多智能体系统的L2增益输出反馈跟踪问题。对于同质线性多智能体系统的情形,将问题转化为求解一系列解耦的单系统的L2增益静态输出反馈控制问题。相比传统的基于线性二次调节器(LQR)最优控制方法所设计的静态输出反馈控制,给出了一个新的基于通讯拓扑谱性质的Riccati方程。基于此设计了分布式输出反馈控制策略,并给出了求解静态输出反馈增益的迭代算法步骤。对于异质线性多智能体系统的情形,将问题转化为两个子问题的求解:1)求解一系列解耦的单系统的L2增益静态输出反馈控制问题;2)求解关于(和通讯拓扑有关的)局部动态补偿器的增益条件。相比已有成果,通过引入一个控制增益矩阵,得到了更加一般的局部动态补偿器,基于此设计了新的分布式控制策略。最后给出数值算例验证了所提出方法的有效性。 3.研究了异质线性多智能体系统的协同输出调节问题。不同于上面所述外界扰动的情形,在输出调节问题框架下,跟随者受到的扰动来自于领导者。不同于已有成果,进一步研究了上述局部动态补偿器,在协同输出调节问题中的可行性。基于此设计了分布式控制策略,并给出数值算例验证了所提出方法的有效性。 4.研究了异质线性多智能体系统的输出包含问题。不同于上面只有一个领导者的情形,在输出包含问题中存在多个领导者,针对跟随者通过引入一个新的基于邻居输出信息的误差变量,将异质线性多智能体系统的输出包含问题转化为相应的协同输出调节问题。设计了适用于多个领导者情形的局部动态补偿器,基于此给出了分布式控制策略。相比已有成果,进一步放宽了对跟随者之间通讯拓扑必须为强连通的限制,取而代之的是,只要求每个跟随者都至少由一个领导者可达。最后给出数值算例验证了所提出方法的有效性。 5.研究了同质与异质线性多智能体系统的二分跟踪问题。在智能体的通讯拓扑中引入负数权值的边,用来描述智能体之间的排斥作用。基于有符号图的结构平衡理论,揭示了一组智能体从协同跟踪到二分跟踪的机理。对于同质线性多智能体系统的情形,基于LQR最优控制的方法,给出了实现二分跟踪的分布式控制策略,并揭示了二分跟踪和协同跟踪的关联。对于异质线性多智能体系统的情形,设计了适用于二分跟踪情形的局部动态补偿器,基于此给出了分布式控制策略。最后给出数值算例验证了所提出方法的有效性。