【摘 要】
:
本文针对具有数据包丢失的网络化控制系统跟踪控制问题,提出了一种新的非策略Q-学习方法,完全利用可测数据,在系统模型参数未知并且网络通信存在数据丢失的情况下,实现系统以
【机 构】
:
沈阳化工大学信息工程学院; 辽宁石油化工大学信息与控制工程学院; 东北大学流程工业综合自动化国家重点实验室;
【基金项目】
:
61673280,61525302,61590922,61503257,辽宁省高等学校创新人才项目(LR2017006)
论文部分内容阅读
本文针对具有数据包丢失的网络化控制系统跟踪控制问题,提出了一种新的非策略Q-学习方法,完全利用可测数据,在系统模型参数未知并且网络通信存在数据丢失的情况下,实现系统以近似最优的方式跟踪目标.首先,刻画具有数据包丢失的网络控制系统,提出线性离散网络控制系统跟踪控制问题;然后,设计一个Smith预测器补偿数据包丢失对网络控制系统性能的影响,构建具有数据包丢失补偿的网络控制系统最优跟踪控制问题;融合动态规划和强化学习方法,提出一种非策略Q-学习算法.算法的优点是:不要求系统模型参数已知,利用网络控制系统可测数据,学习基于预测器状态反馈的最优跟踪控制策略;并且该算法能够保证基于Q-函数的迭代Bellman方程解的无偏性.仿真验证所提方法的有效性.
其他文献
随着工业设计飞速发展,人性化设计已经成为产品设计中流行趋势,在人们日常生活中使用最多的日用陶瓷产品中,人性化设计问题越来越受到人们的关注。人性化设计是人类生存意义
多基地声呐技术将会在未来发挥越来越重要的作用;而基于以太网的声呐湿端数据采集与传输系统在多基地声呐应用中对时间同步技术提出了更高的要求和挑战;文章提出了基于IEEE1588
基于有限元法模拟了受远场拉伸和弯曲载荷有限厚度平板的表面疲劳裂纹扩展。裂纹体网格由等参奇异单元构成,裂纹体和非裂纹体之间采用多点约束连接不匹配的节点;采用1/4节点
"车友会"既是汽车文化的重要载体,也是青年对一种生活方式的群体认同。通过对我国南方的一个车友会的个案研究,本文梳理了汽车的文化逻辑,描述了"SY"车友会的发展现状,揭示出
目的:通过临床观察研究加减膈下逐瘀汤治疗瘀热阻络型慢性乙型肝炎肝纤维化的临床疗效,及临床药用的安全性。方法:通过对符合肝纤维化中医诊断和西医诊断依据门诊和住院就诊
汉语中的颜色词在英语中都有其相对应的词。英语中的颜色词含义丰富多彩,在现代英语中广为使用。本文探讨了英语颜色的表达法,涉及英语颜色词的惯用语的意义及用法,着重指出它们
<正>全国目前共有10万个社区居委会,目前还以每年2000-3000个的速度增加,街道数量接近8000个,每年也在不断增加。这表明,作为一个正处于快速城镇化阶段的发展中大国,我国城市
研究国内心理干预效果评估现状。检索国内核心学术期刊中关于心理干预效果评估的有关文献,时间从2000年到2007年,共获得297篇有效文献并进行定量定性分析。得出结果:本研究检
某体育场工程结构复杂,变截面倾斜构件多,施工难度大,通过清水混凝土技术在该工程中的成功应用,总结了变截面倾斜清水混凝土结构施工技术的施工难点、设计方案和施工技术措施及注
影响机械加工表面质量的因素众多,如果对其不采取合理的措施,就会减少机械的使用期限和服务能力。笔者结合多年的实践经验,并针对影响机械加工表面质量的关键因素,进而提出了