几类不确定非线性系统的自适应动态规划理论研究及其应用

来源 :东北大学 | 被引量 : 0次 | 上传用户:luxintian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,工程控制系统的规模和复杂性不断增加,若设计控制器时不考虑一些不确定项可能导致整个系统性能下降,甚至影响系统稳定性,造成不可预期的损失.因此,提高控制系统的安全性和可靠性变得尤为重要.由于非线性系统本身的复杂性,其控制理论发展的并不完善,相应的非线性系统的控制方法也十分有限,而且多数现有结果主要研究系统稳定性问题,在此基础上的系统性能优化问题却很少被考虑.
  自适应动态规划方法融合了神经网络、强化学习、自适应评价设计等思想,在应用于求解复杂系统的最优控制问题时可以避免动态规划算法中”维数灾难”问题.本文在自适应动态规划理论的基础研究上,结合最优控制、博弈论、以及滑模控制等理论,深入研究了非线性系统的最优跟踪问题以及几类连续不确定非线性系统的鲁棒控制问题,本文的主要工作如下:
  (1)针对带有扰动的非线性多输入不确定系统,通过将鲁棒控制问题转化为多人非零和问题,并研究纳什平衡点的鲁棒特性,来构造不确定系统的控制策略.通过Lyapunov方法得到鲁棒控制策略存在的充分条件.对于纳什平衡点的求解,文中采用在线单网络ADP算法近似求解耦合HJ方程组来得到,算法的实现仅需要在线调整评价网络的权值.利用Lyapunov理论证明了闭环系统状态和神经网络的权值估计误差是一致最终有界的.
  (2)首次将非线性大互联系统的分散跟踪问题转化为由误差系统和孤立子系统组成的时不变增广系统的最优控制问题,间接得到分散式自适应跟踪控制器.为求解非线性HJB方程,提出基于单神经网络的ADP算法,并且在线实时实现.通过在评价网权值更新律中加入一个辅助项,从而避免了初始容许控制这一严苛条件.利用Lyapunov理论证明了跟踪误差信号和神经网络权值误差是一致有界稳定的.
  (3)针对一类带有饱和输入的不确定非线性系统,基于ISM理论和ADP方法,提出了一种新颖的滑模最优控制器.该控制器包含两个部分,其中不连续控制部分保证系统维持在滑模面上,而连续控制部分保证系统状态在滑模动态下沿最优轨迹运动.通过在性能指标函数内引入一个非二次泛函来处理饱和输入问题,并基于执行-评价神经网络架构,利用在线近似学习算法实现近似求解该饱和输入系统的HJB方程.同时,利用Lyapunov理论证明了闭环系统状态和神经网络的权值估计误差是一致最终有界的.
  (4)结合滑模控制与非线性H∞最优控制理论,针对带有执行器故障和不匹配干扰的非线性系统,提出了一种新颖的复合控制策略.该复合控制策略包含两个部分,一部分是不连续滑模切换律,用于消除执行器故障和分离出的匹配扰动分量的影响,另一部分是非线性H∞最优控制,用于保证滑动模态下系统的稳定性.其中H∞控制器是基于执行网-评价网-扰动网架构的在线策略更新算法求解HJI方程来得到.最后,利用Lyapunov理论证明了闭环系统状态和神经网络的权值估计误差是一致最终有界的.
  (5)针对一类带有控制约束的不确定非线性系统,基于ISM和ADP方法,设计了最优保性能滑模控制器.该控制器包含两个部分,其中不连续滑模切换律,保证系统状态维持在滑模面,而连续保性能控制,可保证滑动模态下的闭环系统稳定性及性能上界最小.提出单网络ADP算法来近似求解辅助系统的HJB方程,且算法的实现不需要初始容许控制.最后,利用Lyapunov理论证明了闭环系统状态和权值误差可保证是一致最终有界的.
其他文献
连铸坯表面温度是优化拉坯速度和判断液相穴深度的关键参数,同时还可为二冷配水系统的闭环控制提供反馈信号,这对提高铸坯产量和质量具有重要意义。  现有单光谱及三光谱CCD铸坯表面测温仪能够通过在线重构算法解决氧化铁皮带来的测温波动,稳定性可达±5℃。但测温仪需要预先设定发射率或假定被测目标为灰体辐射,不能保证温度测量的准确性。多光谱测温法在一定程度上可以减小发射率的不确定性对测温结果的影响。然而,将其
基于模间干涉原理的光纤传感器因其结构简单灵活、易于制备、成本低廉等独特的优势而得到人们的广泛关注,在光纤传感领域具有重要研究价值和巨大应用潜力。模间干涉型光纤传感器的核心原理是基于光纤内传导的模式间干涉对外界变化的敏感而实现传感的,随着对传感器特性的深入研究,模间干涉型传感器目前主要面临着检测精度低、解调方法可靠性差、温度交叉敏感问题等。本文研究工作主要是围绕着基于模间干涉原理的光纤传感技术开展的
磁场检测在很多领域都有重要的应用,例如军事,工业和电力系统传送等领域。与传统的电磁传感器相比,光纤磁场传感器由于其体积小、灵敏度高及抗电磁干扰等优点吸引了众多研究学者的关注。光子晶体光纤因其灵活的空气孔结构而具备很多独特的光学特性,也使其易于通过与敏感材料的结合实现传感的目的。磁流体作为一种新型的功能介质,它有许多磁光特性,如双折射特性、法拉第效应、场透射特性和可调折射率特性等,近年来,基于磁流体
随着科学技术的不断发展,工业系统的规模和复杂程度也不断增加,通过传统的基于机理建模的方法得到系统精确的数学模型也越加困难,且需要花费大量的时间与精力。此外,许多工业系统在运行过程中均能产生大量的离线和在线输入、输出数据,这启发人们思考如何利用数据取代机理模型,直接设计相应的数据驱动控制方法。对于无故障的线性或仿射非线性系统,基于自适应动态规划技术,可利用系统的输入、输出数据(无需系统矩阵、系统动态
切换系统作为一类重要的混杂系统,可以描述许多实际的复杂系统,一般由有限数量的子系统和控制这些子系统切换的切换信号构成。由于切换系统在通讯、化工、电力、制造等领域的广泛应用,关于切换系统的稳定、镇定、观测、滤波和降阶等问题的研究已取得大量的成果。然而,现有的研究大多建立在控制器模态与系统模态完全保持同步的条件下,这在实际系统中是难以实现的。控制器模态与系统模态出现异步的情况称为异步现象,当切换系统系
学位
能源作为国家维系经济发展的重要资源,其开采和应用的先决条件是能源的运输。相比于其他运输方式,管道运输具有运输量大、资源消耗少、建设周期短、安全可靠性高、利于环保等优点。管道运输业距今已有一百五十多年的历史,然而管道在长年使用过程中,难免会遇到腐蚀、磨损等问题,进而破坏管道原有结构形成不同程度的损伤。这种损伤若不及时发现并修理,极可能在高压高温的工作环境下,演变成为管道穿孔或破裂,导致输送的能源发生
学位
磁感应断层成像(MagneticInductionTomography,缩写为MIT)是一种新兴的电磁特性成像技术,该技术是在外加交流激励磁场的作用下,目标导体会因电磁感应作用而产生涡流,当目标导体发生变化时,涡流的强度和分布也会随之发生相应的变化,通过测量检测线圈的信号,再利用合适的图像重构算法重建出目标导体内部结构的分布图。MIT技术具有无辐射、非侵入、非接触以及能实现实时图像监护等优点,因此
学位
在过去的近二十年中,随着科学技术的迅速发展和社会生产需求的不断提高,最优控制越来越成为控制领域的一个研究热点。传统的非线性最优控制方法由于受到诸多限制,导致其难以应用普及。近些年来,为了更好地求解非线性最优控制问题,一种结合强化学习机制的自适应动态规划方法(Adaptive Dynamic Programming)被提出,该方法依托强化学习的理念构建了评价-执行框架,利用函数近似结构来逼近动态规划
神经动力系统是人工智能发展中的重要元素,也是智能自动化研究中的有效工具,当前在图像处理、模式识别、记忆存储、最优化等方面具有广泛的应用。本文主要针对神经动力系统的稳定性分析与综合进行深入研究。从研究对象来看,本文主要考虑递归神经网络和忆阻神经网络。忆阻神经网络是将传统递归神经网络的电阻替换为忆阻而形成的,可以看作是递归神经网络的一个升级版。在诸多应用中,忆阻神经网络也展现出比传统递归神经网络更多的
随着现代科学技术水平的提高,控制系统的自动化规模和复杂程度也迅速增长。人们对现代化生产系统运行可靠性和安全性越来越高的要求是故障诊断技术产生并迅速发展的原因。在实际工程实践中,如果系统一旦发生故障,那么它带来的经济损失是难以估量的,而故障估计可以及时并准确地对系统故障大小和形状进行有效描述,因此通过故障估计来进一步地为故障诊断提供定量的故障信息就显得尤为重要。另外一方面,由于T-S模糊模型能够以任