【摘 要】
:
设计了一种基于折扣广义值迭代的智能算法,用于解决一类复杂非线性系统的最优跟踪控制问题.通过选取合适的初始值,值迭代过程中的代价函数将以单调递减的形式收敛到最优代价函数.基于单调递减的值迭代算法,在不同折扣因子的作用下,讨论了迭代跟踪控制律的可容许性和误差系统的渐近稳定性.为了促进算法的实现,建立一个数据驱动的模型网络用于学习系统动态信息,同时构造评判网络和执行网络用于近似迭代代价函数和计算迭代跟踪控制律.值得注意的是,我们提出了新颖的停止准则来保证迭代跟踪控制律的有效性.这种停止准则包含两个条件,一个条件
【机 构】
:
北京工业大学信息学部 北京100124;计算智能与智能系统北京市重点实验室 北京100124;北京人工智能研究院 北京100124;智慧环保北京实验室 北京100124;北京科技大学自动化学院 北京1
论文部分内容阅读
设计了一种基于折扣广义值迭代的智能算法,用于解决一类复杂非线性系统的最优跟踪控制问题.通过选取合适的初始值,值迭代过程中的代价函数将以单调递减的形式收敛到最优代价函数.基于单调递减的值迭代算法,在不同折扣因子的作用下,讨论了迭代跟踪控制律的可容许性和误差系统的渐近稳定性.为了促进算法的实现,建立一个数据驱动的模型网络用于学习系统动态信息,同时构造评判网络和执行网络用于近似迭代代价函数和计算迭代跟踪控制律.值得注意的是,我们提出了新颖的停止准则来保证迭代跟踪控制律的有效性.这种停止准则包含两个条件,一个条件用来保证迭代跟踪控制律的可用性,这有利于评估误差系统的渐近稳定性;而另一个条件用来确保跟踪控制律的近似最优性.最后,通过包括污水处理在内的两个应用实例验证了本文提出的近似最优跟踪控制方法的可行性和有效性.
其他文献
隧洞穿越地区地形复杂,隧洞工程勘察难度大,钻机施工困难,物探工作难度大,快速有效地开展工程勘察安全性评价工作对后期施工具有重要意义.以某项目为依托,综合利用以往地质资料,采用温纳和斯伦贝谢两种装置高密度电法工作,分析其不同装置高密度电法工作原理及应用效果.温纳装置探测深度较大,横向分辨率较高,高阻异常体特征反映较明显;斯伦贝谢装置探测深度相对较浅,其垂向分辨率较高,抗干扰能力强,低阻异常体反映较明显.
虽然深度神经网络(Deep neural networks,DNNs)在许多任务上取得了显著的效果,但是由于其可解释性(In-terpretability)较差,通常被当做“黑盒”模型.本文针对图像分类任务,利用对抗样本(Adversarial examples)从模型失败的角度检验深度神经网络内部的特征表示.通过分析,发现深度神经网络学习到的特征表示与人类所理解的语义概念之间存在着不一致性.这使得理解和解释深度神经网络内部的特征变得十分困难.为了实现可解释的深度神经网络,使其中的神经元具有更加明确的语义
通过学习可观测数据的概率密度而随机生成样本的生成模型在近年来受到人们的广泛关注,网络结构中包含多个隐藏层的深度生成式模型以更出色的生成能力成为研究热点,深度生成模型在计算机视觉、密度估计、自然语言和语音识别、半监督学习等领域得到成功应用,并给无监督学习提供了良好的范式.本文根据深度生成模型处理似然函数的不同方法将模型分为三类:第一类方法是近似方法,包括采用抽样方法近似计算似然函数的受限玻尔兹曼机(Restricted Boltzmann machine,RBM)和以受限玻尔兹曼机为基础模块的深度置信网络(
深度强化学习是人工智能领域新兴技术之一,它将深度学习强大的特征提取能力与强化学习的决策能力相结合,实现从感知输入到决策输出的端到端框架,具有较强的学习能力且应用广泛.然而,已有研究表明深度强化学习存在安全漏洞,容易受到对抗样本攻击.为提高深度强化学习的鲁棒性、实现系统的安全应用,本文针对已有的研究工作,较全面地综述了深度强化学习方法、对抗攻击、防御方法与安全性分析,并总结深度强化学习安全领域存在的开放问题以及未来发展的趋势,旨在为从事相关安全研究与工程应用提供基础.
因子分析是一种在工业领域广泛使用的统计学方法.在金融资产管理中,因子分析通过对历史价格波动的极大似然估计推导自适应的统计学因子来生成风险模型.与通过使用预先设定具有经济学含义的因子来生成风险模型的基本面因子模型相比,通过因子分析生成的模型不仅更灵活,还能发现在基本面模型中缺失的因子.然而,由于因子分析所生成模型中的统计学因子缺少可解释性,因此当金融数据中存在显著噪音时容易过拟合.针对中国股市数据的风险模型生成问题,本文提出快速因子分析算法以及将基本面因子结合到因子分析中的挑选基本面因子的混合因子分析方法,
为保证预测控制的稳定性,经典的策略是在预测控制的优化问题中加入终端约束集和终端惩罚函数,并保证终端约束集是一个在终端控制律作用下的正不变集,终端惩罚函数是受控系统的局部控制Lyapunov函数.本文提供了一种求解非线性系统终端约束集、终端控制律和终端惩罚函数的新策略.通过在优化问题中引入新的变量来降低求解终端约束条件的保守性,并且可以从理论上保证求解得到的终端约束集更大.通常情况下,较大的终端约束集将允许选取的预测时域较小,因而可以降低预测控制的在线计算负担.从形式上看,新的变量的引入使得终端约束集和终端
本文研究了一类分布式优化问题,其目标是通过局部信息交换使由局部成本函数之和构成的全局成本函数最小.针对无向连通图,我们提出了两种基于比例积分策略的分布式优化算法.在局部成本函数可微且凸的条件下,证明了所提算法渐近收敛到全局最小值点.更进一步,在局部成本函数具有局部Lipschitz梯度和全局成本函数关于全局最小值点是有限强凸的条件下,证明了所提算法的指数收敛性.此外,为了避免智能体之间的连续通信和减少通信负担,将所提的两种分布式优化算法与事件触发通信相结合,提出了两种基于事件触发的分布式优化算法.证明了提
高速铁路信号系统是高速铁路安全可靠运营的核心装备,实现高速铁路信号系统智能运维是降低高速铁路运行风险的必要基础保障.目前,我国高速铁路信号系统运维研究工作主要集中于器件级系统或基本单元系统,系统层面的相关研究几乎为空白,亟需从整体上建立全局架构理论模型.为此,定义了关联信号系统,提出了分散式动态评估函数,将动态调度纳入运维体系,构建了分层架构模型.在此基础上,针对分层架构模型的决策层和关联信号层,提出了动态定量评估、动态风险预警和故障诊断的研究方法,并展望了所面临的挑战.
混合动力电动汽车(Hybrid electric vehicles,HEVs)的能量管理问题至关重要,而混合动力电动汽车的跟车控制不仅涉及跟车效果与安全性,也影响着能量的高效利用.将HEVs的跟车控制与能量管理相结合,提出一种基于安全距离的HEVs车辆跟踪与能量管理控制方法.首先,考虑坡度、载荷变动建立了HEVs车辆跟车系统的非线性模型,并基于安全距离,提出一种基于道路观测器的动态面控制(Dynamic surface control,DSC)进行车辆跟踪控制.然后,结合跟踪控制下工况循环,采用滚动动态规
列车精确停车作为列车自动运行(Automatic train operation,ATO)系统的一项核心功能,对高速列车的安全和高效运行至关重要.本文针对高速列车停车过程的特点,考虑在避免控制输出频繁切换的前提下实现高精度的停车曲线跟踪,提出了基于模型预测控制(Model predictive control,MPC)的精确停车算法.针对列车停车过程中外部不确定性阻力干扰,采用鲁棒模型预测控制方法,提高对外部干扰的鲁棒性.引入自触发控制策略,以进一步减少控制输出的频繁切换,提高停车过程的舒适度.该方法不需