论文部分内容阅读
在工业过程控制中,传统的依据物理化学机理建立精确数学模型来对生产过程和设备进行控制、预报和评价已变得越来越困难。数据驱动控制就是一种直接从数据到控制器设计的控制理论和方法,它将控制器从传统的模型控制中解脱出来,解决了对受控对象数学模型结构的依赖和未建模动态的问题。论文从各种典型的数据驱动控制理论与方法研究出发,在梯度信息估计算法框架和控制器参数辨识结构框架下,提炼出它们共同的基础理论,建立基于随机逼近的数据驱动控制方法局部体系。论文就以下几个方面开展深入系统的研究,并取得了一些成果。1.研究了两种典型的随机逼近算法:基于梯度的Robbins-Monro随机逼近算法和免梯度的Kiefer-Wolfowitz随机逼近算法。从函数极值角度转换到控制问题角度,研究了同时扰动随机逼近算法(简称SPSA),同时对单值SPSA、二阶自适应SPSA算法及其改进形式的优缺点进行了研究。论文提出,控制问题中的SPSA算法比方程求根或函数极值问题中的SPSA算法更强调实效性和稳定性,算法应在收敛精度和收敛速度上有所权衡。因此论文提出了一种针对控制问题的单边SPSA算法,能够在实际控制中节约量测数据,仿真表明,该算法良好权衡了收敛速度和收敛精度,比其它SPSA算法更能够适用于控制问题。2.针对受控系统的数学模型完全未知,论文采用SPSA算法建立了有效的数据驱动控制方法。论文提出并解决了基于SPSA的数据驱动控制的两个关键问题:数据利用问题以及面向控制的SPSA方法问题。数据驱动控制中数据的信息量和有效性决定了控制的品质,如何有效地选取测量数据计算控制率是一个关键问题。论文将单边SPSA算法与数据驱动控制问题结合,提出了基于动态偏差的数据利用方案,并将控制参数的标定转换成扰动向量的标定问题,对神经网络结构的函数逼近器进行直接自适应权值调整,完全不依赖于对象模型,对非线性对象进行了控制仿真,控制结果表明了该方法的有效性。3.提出将迭代反馈整定方法(简称IFT)分为完全无模型IFT和基于模型的IFT,重点研究了将迭代反馈整定应用于大滞后系统,结合Smith预估结构,提出了一种大滞后系统数据驱动直接控制算法。着重针对过程大时滞的特点,在性能指标中加入了预估误差惩罚因子。提出了一种新的步长设置方法,使得步长的下降速率可调,设置了一种可变时间权重系数,根据实际的迭代次数进行调整,保证了系统的稳定性。研究表明,改进方法使得IFT能够在抗滞后方面表现出较强的收敛性和稳定性,并且降低了对迭代初值的要求。4.不同于以往根据待整定参数确定IFT实验次数,论文提出在保证梯度无偏的前提下,找到IFT所需的最小实验次数的实验准则。通过规则设计了三个闭环实验来求取性能指标梯度向量的无偏估计,完全利用输入输出数据对广义控制器参数实现了自整定,有效地减轻迭代所需的数据量,加快控制器优化的速度,在IFT的在线整定中发挥关键作用。5.深入分析了虚拟参考反馈整定VRFT与内模控制的等价性,将虚拟参考反馈整定数据驱动方法引入到IMC-PID控制器的整定中来,提出了一种不基于模型参数的VRFT-IMC参数整定方法。该方法集合了内模控制鲁棒性强和数据驱动控制的自适应性较好的各自优点,控制性能优于普通IMC-PID控制器,可用于复杂过程的控制器参数的初始整定和实时自整定。6.针对离线虚拟参考反馈整定算法要求整定过程中对象特性保持不变的缺点,提出了一种在线VRFT数据驱动算法。首先利用滤波器改变了离线算法的时序,得到用于实时运算的有效数据,提出了基于带遗忘因子递推最小二乘法的VRFT控制器参数辨识方法,不依赖于对象模型,完全利用实时数据实现了在线控制器参数整定。仿真结果表明,在对象特性变化较大的情况下,在线VRFT整定方法优于传统的离线VRFT方法,具有很好的自适应性。论文最后对全文进行了总结,并指出若干有待于今后进一步研究的内容。