数据驱动的离散时滞系统的自适应动态规划最优控制策略研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:zhexiu1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的近二十年中,由于信息科学技术的飞速发展,使得包括机器人、冶金、化工、微电网、航空、风力发电等行业发生了巨大的变化。如何使用工业过程中产生的大量数据来实现目标系统的优化控制的问题,一直都是工程控制领域的难点问题之一。随着大数据技术的发展,基于数据驱动的控制方法得到了前所未有的关注。因此,本文将数据驱动技术与自适应动态规划(ADP)算法相结合,研究了离散时滞系统的优化控制问题。首先,针对模型未知的离散系统的跟踪控制问题,提出了一种基于ADP算法的最优跟踪控制方法。提出了一种基于数据驱动ADP算法的控制方法,有效地解决了离散时滞系统的最优控制和跟踪问题。针对带有扰动的离散系统的跟踪控制问题,提出了一种新型的基于ADP的跟踪控制方案。最后,通过一些数值仿真验证了本文所提出的方法的有效性。本文的主要内容和贡献可概述如下:
  (1)针对模型未知线性离散系统的最优跟踪控制问题,提出了一种基于ADP的最优跟踪控制方案。首先,通过系统变换,将最优跟踪问题转化为无穷域跟踪误差动态的最优调节问题。其次,使用控制输入的历史数据和误差系统的状态,构建了扩展的误差状态方程。最后,针对本章所研究的跟踪控制问题,分别提出了基于历史数据的策略迭代和值迭代控制方法。
  (2)提出了一种新型迭代ADP算法,解决了多时滞线性离散系统的最优跟踪控制问题。首先,通过坐标变换,推导出了多时滞系统的最小时滞等价系统,并且给出了两个系统的等价条件。其次,针对最优跟踪控制问题,构建了增广最小时滞系统,并设计了相应的带有折扣因子的增广性能指标函数。在此基础上,提出了一种无模型的迭代ADP算法,用于求解多时滞线性系统跟踪问题的最优控制律。
  (3)针对一般线性离散时滞系统的最优跟踪问题,提出了一种数据驱动ADP算法来获取最优跟踪控制策略。首先,在系统内部状态已知的情况下,提出了一种无模型的基于增强Q学习的跟踪控制方法。其次,在系统动态和内部状态都未知的情况下,基于系统的输入、输出和参考轨迹组成的历史数据集,构建了一种新的基于数据的增广状态方程,并将其作为状态估计。然后,推导出了一种新的关于线性二次跟踪问题的数据驱动贝尔曼方程。最后,提出了一种基于数据驱动ADP的最优跟踪控制方案,有效地解决了一般时滞系统的线性二次跟踪问题,并且不需要已知系统动态和状态的信息。
  (4)提出了一种基于数据驱动ADP的优化控制方法,有效解决了多时滞离散时间系统的最优控制问题。首先,推导出了适用于数据驱动ADP算法的等价多时滞系统,并给出了该等价时滞系统的存在条件。然后,根据时滞系统的特点,以输入和输出数据的形式,推导出了一种新的基于数据的状态方程和贝尔曼方程。最后,提出了一种新的数据驱动ADP算法,在仅使用测量到的系统输入和输出数据的条件下,解决了线性多时滞系统的输出反馈最优控制问题。
  (5)针对一类带有扰动的离散时滞系统的H∞跟踪控制问题,研究了一种基于数据驱动ADP算法的自适应跟踪控制方案。首先,将被控系统和参考轨迹系统组成一个增广的离散时滞系统。然后,将该系统变换为一个由系统输入、输出和参考轨迹表示的离散时滞系统,这使得系统的状态完全由该系统的运行数据所替代。接下来,根据贝尔曼最优性原理,推导出了关于H∞跟踪控制问题的基于数据驱动的贝尔曼方程。最后,提出了一种基于数据驱动ADP算法的控制策略,从而解决了离散时滞系统的H∞跟踪控制问题。
其他文献
随着现代科学技术水平的提高,控制系统的自动化规模和复杂程度也迅速增长。人们对现代化生产系统运行可靠性和安全性越来越高的要求是故障诊断技术产生并迅速发展的原因。在实际工程实践中,如果系统一旦发生故障,那么它带来的经济损失是难以估量的,而故障估计可以及时并准确地对系统故障大小和形状进行有效描述,因此通过故障估计来进一步地为故障诊断提供定量的故障信息就显得尤为重要。另外一方面,由于T-S模糊模型能够以任
随着科学技术的发展,工程控制系统的规模和复杂性不断增加,若设计控制器时不考虑一些不确定项可能导致整个系统性能下降,甚至影响系统稳定性,造成不可预期的损失.因此,提高控制系统的安全性和可靠性变得尤为重要.由于非线性系统本身的复杂性,其控制理论发展的并不完善,相应的非线性系统的控制方法也十分有限,而且多数现有结果主要研究系统稳定性问题,在此基础上的系统性能优化问题却很少被考虑.  自适应动态规划方法融
多目标优化问题广泛存在于电力系统环境经济负荷分配、轧制负荷分配、汽车稳健优化设计和水资源调度优化等工业生产过程,常规基于Pareto支配的多目标优化算法适合求解低维多目标优化问题,却难以求解包含三个或三个以上目标的高维多目标优化问题。随着分解标量化函数和各种性能评价指标的出现,进化多目标优化算法可以求解高维多目标优化问题。R2指标是一种通过给定权值向量和效用函数来评价候选解综合性能的评价指标,具有
自医学影像应用到临床医学以来,随着数字图像处理技术的发展,医生从不同模态的医学图像中获取信息的内容和方式也发生了变化。从单纯的观察组织结构和解剖结构,发展到利用去噪、分割、配准、分析和重建等图像处理方法对器官组织或病灶进行定位、分割、参数分析以及提取特征等多方面。在从低层到高层的数字图像处理技术中,图像分割是医学图像处理中的关键技术。基于变分水平集方法活动轮廓模型具有便于处理拓扑结构变化、计算精度
动态系统的耗散性以输入输出的方式描述了系统能量的演化规律,即系统内部存储的能量不超过外界对它供给的能量。耗散性在非线性系统的研究中起着重要作用,是非线性系统分析和设计的有力工具。在切换系统中,除了各子系统内部的能量演变外,切换系统各子系统之间也有能量的传递和交换。这两方面能量的演化规律在相当程度上决定了切换系统的动态行为。因此,对切换系统来说,能量和基于能量的控制显得更加重要。然而,传统的耗散性概
日新月异的信息技术和不断深入的经济全球化进程促进了各行各业的蓬勃发展,这给许多面向项目运营的业务模式带来了前所未有的机遇,同时也导致项目变得规模庞大而复杂,特别对于规模以上项目,单个企业很难胜任,需要挑选若干合适的伙伴共同完成。并且,项目所处环境与运行过程中存在政策、天气、金融、人的行为与心理等在内的不确定性因素,导致项目面临的不确定性和风险大大增加。因此,作为项目管理中的重要环节,不确定环境下的
在现代工业体系中,面对日益复杂化韵被控对象,传统的集中式控制策略逐渐难以满足对生产控制的综合要求。为了解决复杂的大型系统的控制问题,越来越多的学者开始关注多智能体系统。由于多智能体系统是通过多个智能体之间的相互协作来完成特定的复杂控制目标,所以它具有设计灵活性高,鲁棒性强等优点。考虑到在实际生产过程中多智能体系统规模较大,通讯网络结构复杂,所以随着时间的增长和内外部条件的变化,系统不可避免地会出现
学位
医学图像处理与分析是指利用计算机对医学图像进行自动处理、特征抽取和分类的技术。由于眼底图像结构复杂,使得目前的眼底图像智能处理与分析方法仍存在诸多的关键技术难点,例如光照不均和低对比度下的目标定位、复杂背景下的目标精准提取、样本不平衡情况下的目标分类等。本文在分析总结国内外相关研究成果的基础上,针对现有方法的不足,提出了多种新型且有效的方法用于眼底目标智能分析与检测任务,包括视神经盘、视网膜血管、
学位
由于灵活的结构设计和优异的光学性能,光子晶体光纤是目前新型光电器件领域的研究热点之一。光纤传感具有抗电磁干扰、灵敏度高、绝缘性好、可实现分布式测量等优点,光子晶体光纤的多孔特性有利于通过填充光电功能材料扩展或提升其性能,光子晶体光纤的D型化并镀膜处理有利于增强光纤的倏逝场与被测物质的交叠。由于光子晶体光纤结构的特殊性,其制备工艺的难度一直限制着光子晶体光纤在传感领域的发展。本文数值研究了材料填充和
随着数字化中国的推进,中国已经全面迈向了信息化的时代。无线传感器网络作为物联网主要的技术支撑应用前景广泛,现已应用于军事作战、环境监测、医疗卫生、工业生产、智能家居等领域。定位技术作为无线传感器网络最关键的技术之一,备受研究者们的关注。本文以室内环境为对象进行研究,在总结了国内外研究现状的基础上,对非视距环境下的无线传感器网络静态节点和动态节点定位问题进行深入研究,旨在实现复杂环境下高精度、自适应