基于模型参考自适应评价学习的多智能体系统同步控制

来源 :中国地质大学 | 被引量 : 0次 | 上传用户：ninikao

【摘要】

：

由于多智能体系统在各实际领域中都具有十分广泛的应用,协调控制作为多智能体系统研究的一个重要分支受到了普遍关注。多智能体分布式同步控制是协调控制的一个基本研究方向

【作者】

：

符浩

【出处】

：

中国地质大学

【发表日期】

：

2020年01期

【关键词】

：

多智能体系统自适应评价设计最优同步控制模型参考自适应控制非线性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

由于多智能体系统在各实际领域中都具有十分广泛的应用,协调控制作为多智能体系统研究的一个重要分支受到了普遍关注。多智能体分布式同步控制是协调控制的一个基本研究方向。同步控制是指以网络作为智能体之间信息交流的通信媒介,通过设计控制器或控制协议,实现各智能体行为一致。现有相关研究更多地针对简单动力学模型的多智能体系统,比如单或双积分器。而且,其控制协议的设计依赖于系统动力学模型。然而,实际多智能体系统往往是复杂非线性系统,包括外界扰动与系统动力学模型未知。另外,在实际中也要求多智能体系统具有柔性协作能力和最优系统性能。以上实际情况引起耦合Bellman方程求解困难的问题,导致难以实现非线性多智能体系统的分布式同步控制,因而大大限制了多智能体系统在复杂环境下的应用。为此,基于自适应评价设计(Adaptive critic designs,ACDs)的自学习特点,本文展开基于ACDs的复杂非线性多智能体系统分布式同步控制研究。本文的主要研究内容概括如下。(1)模型未知单输入非线性系统的模型参考自适应评价学习控制针对具有持续扰动的模型未知单输入非线性系统,为解决模型参考自适应控制中由ACDs引入的神经网络逼近误差问题,提出模型参考自适应评价学习(Model reference adaptive critic learning,MRACL)控制方法,实现非线性系统在线实时柔性跟踪参考模型行为,同时保证闭环控制系统最优控制性能。同时,该方法也可保证无抖振滑模控制的可实施性,进而实现对逼近误差与扰动的抑制。(2)模型完全未知多输入非线性系统的监督模型参考自适应评价学习控制在模型参考自适应评价学习控制方法的基础上,针对多输入非线性系统,在不要求有界系统漂移动力学的假设下,通过引入监督器到模型参考自适应评价学习控制,研究了监督模型参考自适应评价学习控制方法,并定义了学习模式和控制模式。引入的监督器不仅可以指导执行-评价网络的学习,而且也可以产生无抖振滑模控制量,解决了模型未知多输入非线性系统持续扰动和神经网络逼近误差的鲁棒性问题。(3)模型部分未知非线性多智能体系统最优同步控制针对模型部分未知的非线性多智能体系统,局部邻域跟踪误差动力学引入了邻居智能体状态,导致耦合Bellman方程求解更为困难,这是最优同步控制协议设计的关键难点。针对这一问题,本文构造了一种分层分布式最优同步控制结构。在分散式模型参考控制层采用神经网络自适应控制方法,实现各个智能体跟踪相应的参考模型行为;在分布式最优同步控制层中,以各参考模型和领导者为个体构建参考多智能体系统,研究了分布式值迭代学习方式,并提出了分布式模型参考自适应评价学习同步控制方法,使参考多智能体系统达到Nash均衡,保证所有参考模型行为一致,实现多智能体系统最优同步控制。(4)模型完全未知非线性多智能体系统最优同步控制针对非线性多智能体系统动力学模型完全未知的情况,构建了基于无模型分布式模型参考自适应评价学习的分层分布式最优同步控制结构。在分散式模型参考控制层,为了降低最优同步控制的计算量,设计了一种类离线神经网络自适应控制器;在分布式最优同步控制层中,提出了分布式参考策略迭代学习方式,获得具有复合函数的耦合Bellman非线性方程的Nash均衡解,并发展了无模型分布式模型参考自适应评价学习同步控制方法,在不利用系统模型先验知识下,保证多智能体系统达到最优同步。(5)具有激活领导者的多智能体系统最优同步控制针对具有外界扰动的激活领导者系统,构建了基于分布式监督模型参考自适应评价学习的分层分布式最优同步控制结构。在分散式模型参考控制层,采用所提的监督模型参考自适应评价学习控制方法,实现对外界扰动和逼近误差的抑制;在分布式最优同步控制层中,以各参考模型为个体构建参考多智能体系统,发展分布式监督模型参考自适应评价学习同步控制方法,使得参考多智能体系统达到Nash均衡,实现多智能体系统的最优同步控制,并保证多智能体系统的柔性协作能力。

其他文献

基于个性化推荐的演艺交易系统的研究与实现

随着互联网和计算机技术的不断发展,电子商务极大的改变了人们的生活方式。面对各大电商平台上丰富多彩的物品,如何将物品高效的“匹配”给需要它的用户成为一个难题。解决上述问题不可或缺的工具是推荐系统,巨大的购买能力和购买需求给了推荐系统工业价值。但是传统的推荐技术难以有效的解决数据稀疏性、冷启动、推荐实时性等问题,此外,在大数据背景下推荐系统的工程实施也一直是领域内的研究难点与热点。为了解决上述问题,依

学位

推荐技术神经网络长短期记忆多层感知机侧面情感联合模型

W公司基于IPD的工艺开发能力提升

近年来,随着高铁、飞机、私家车的普及,客车市场的“蛋糕”越来越小;同时,纯电动、燃料电池等新能源技术的快速兴起,催生出一批新生的客车企业,导致客车市场的竞争日趋激烈。

学位

工艺开发IPD模式流程

优化营商环境视角下的反垄断法制度完善研究

近年我国经济稳步增长,为延续发展趋势需不断解放社会生产力,加快建设现代化经济体系,营造良好市场环境。完善市场经济发展配套制度的法律规定,为营商环境优化提供法治保障乃

学位

营商环境行政性垄断经济性垄断反垄断执行

基于结构光测量技术的接触轨检测方法研究

结构光测量技术用于地铁线路中的接触轨检测任务,具有很多的优势。从行业现状上看,传统的人工对接触轨进行接触式测量,由于检测效率低、工作量大,已经不能满足现在地铁线路的维护工作要求,急需一种便携式的自动化检测工具提供支持。从技术优势上看,结构光测量技术具有非接触性、抗干扰性强、测量精度高等优势,拥有很大的发展前景和应用价值,完全满足接触轨的检测要求。结构光测量技术主要有三角测量和双目测量这两种典型的技

学位

三角测量接触轨检测结构光中心提取最近点迭代切片统计

基于非局部特征的心脏电生理无创重建

心脏电生理活动的无创重建对临床疾病预防和外科治疗具有重要意义。获取三维心肌跨膜电位(Transmembrane Potential,TMP)的分布有助于诊断心肌缺血、异位起搏等心脏疾病。然

学位

心电逆问题心肌跨膜电位非局部自相似性深度学习

MBOC及动态DBOC信号的捕获算法研究

在有限的频带资源中,随着卫星发射数量的增多,不同导航系统之间难免会产生干扰。二进制偏移载波(Binary Offset Carrier,BOC)及其衍生信号的提出,为避免频带拥挤提供了有效的

学位

BOC信号信号捕获残余频偏窄带干扰高动态

基于离散根轨迹的轧机板厚滞后系统的研究

近年来,轧机的板带厚度自动控制技术日臻完善,以及在轧机上安装使用各类高精度测量仪器,特别是不断提高的计算机技术与轧机的结合,让板厚精度得到不断的提高。但是许多现代化工业对板厚精度的要求也越来越高,故板厚精度还有待提高。在轧机的板带厚度自动控制系统中,为避免测厚仪受到损坏,测厚仪的安装位置需要与轧机的辊缝有一定的安全距离。这个安全距离会使得测厚点与轧制点不是同一点而会使板带的出口厚度测量产生一定的滞

学位

轧机的板带厚度自动控制滞后调节周期离散根轨迹

基于TSV容错提升3D IC良率的方法研究

三维集成电路(3D IC,Three-dimensional Integrated Circuit)将多块芯片在垂直方向上堆叠起来,通过硅通孔(TSV,Through Silicon Via)实现多层芯片之间的电气连接,将其封装成

学位

三维集成电路硅通孔聚簇故障冗余TSV容错

防波堤布置对浮式结构物水动力性能的影响

随着我国南海岛礁建设如火如荼的展开,海洋结构物作业的安全性越来越受到人们的关注,但将海洋结构物暴露在恶劣的海洋环境中是极其危险的。因此有必要对作业中的海洋平台进行掩护设计。防波堤的存在能极大的改善海洋平台的运动、气隙等诸多水动力性能因素,从而提高海洋结构物作业的安全性。因此,本文基于ANSYS 18.0流体分析模块,对不同防波堤布置形式下海洋结构物的水动力问题进行研究。本论文的主要工作如下:(1)

学位

数值波浪水池波浪衰减波浪爬高气隙防波堤

适用于高频动力分析的轮轨接触简化模型研究

精确预测高频动力作用下的轮轨相互作用和瞬态滚滑行为一直是轮轨关系研究的基础也是该研究领域的难题之一。针对轮轨高频动力作用问题,传统上多采用动力学方法,该方法计算时间成本低但在高频动力条件下的计算精度不足。近年来,虽然基于显式有限元方法的高速轮轨瞬态滚动接触有限元模型已逐渐成熟,可适用于轮轨高频动力作用的计算,但计算成本过高,很难应用于大批量或实时分析。本论文建立了基于显式有限元的三维高速轮轨瞬态滚

学位

轮轨高频动力作用显式有限元法多体动力学Hertz弹簧钢轨波磨修正法向接触模型

基于模型参考自适应评价学习的多智能体系统同步控制

其他学术论文