论文部分内容阅读
基于多agent系统(Multi-agent systems,MAS)的分布式智能控制正在蓬勃兴起,以适应计算机支持的协同工作等应用需求,因而使得对MAS中的联盟研究也变得越来越重要。如何形成一个稳定均衡的联盟,使联盟朝着稳定的方向发展,是控制理论的前沿课题,已经成为迫切需要解决的关键问题。传统的研究方法仅考虑一个agent只能加入一个联盟,势必造成agent能力和资源的极大浪费,而且在很多应用场合不能满足实际系统的需要。基于上述背景,本文提出“复杂联盟”的概念,并引入群智能技术,力图在多任务环境中实现真正意义上的一个agent可以同时加入多个联盟和一个联盟可以同时承担多个任务,从而能在一定程度上提高系统的任务求解效率和资源利用率,为解决复杂控制问题提供理论指导和方法依据。本文的主要内容及创新之处如下:(1)提出一种基于多粒子群协同优化的复杂联盟串行生成算法。基于图论的思想,给出了“虚拟agent”的概念,旨在转移父联盟的剩余能力,由“虚拟agent”代表其父联盟参与后续任务的竞争,在一定程度上解决了agent资源和能力的浪费问题。实验结果表明,本算法对于任务较多且较简单的情形特别有效。(2)将离散粒子群算法扩充到二维二进制编码,实现复杂联盟的并行生成。算法中设计的编码有效性检查、冲突消解策略克服了求解过程中因多个任务求解联盟同时竞争某个能力有限的agent而导致的资源冲突和联盟死锁,而且实现了真正意义上的一个agent可以参加多个联盟,在一定程度上可以提高系统的资源利用率。(3)提出一种基于按劳分配和效用非减的效用分配策略。针对已有工作无法摆脱搭便车问题,导致联盟潜在的不稳定,采用拍卖机制对任务进行快速和有效分解,基于合同机制对联盟效用以及额外效用进行合理分配,并依据联盟机制的数学模型推导出了局部效用非减和全局效用非减应满足的条件。该策略既严格遵循按劳分配又完全符合效用非减,在具有超加性的面向任务的领域中可以形成全局最优联盟,并具有Nash均衡意义下的稳定性。(4)基于Markov过程和鞅理论推演了蚁群算法的几乎处处强收敛性,并提出一种基于蚁群正反馈的动态联盟形成策略。利用蚁群中的信息素浓度表示熟人之间的熟悉度,以信息素更新规则作为熟悉度调整规则。仿真实验的测试及分析说明了该策略能在一定程度上降低整个系统的通信代价和资源开销,提高了系统的可靠程度。