【摘 要】
:
作为典型的强人工智能方法,强化学习已经开始被尝试应用于真实控制任务中.为了探究连续型强化学习在物理系统控制中的效果,以一阶倒立摆系统的平衡控制为实例,使用强化学习方法和经典PID控制方法对倒立摆系统分别进行建模与控制实现,并着重对控制表现进行对比分析,结果表明在该控制任务中连续强化学习训练所得的控制策略对扰动的反应更迅速,并具有更强的稳定性.
【机 构】
:
上海大学机电工程与自动化学院,上海200444
论文部分内容阅读
作为典型的强人工智能方法,强化学习已经开始被尝试应用于真实控制任务中.为了探究连续型强化学习在物理系统控制中的效果,以一阶倒立摆系统的平衡控制为实例,使用强化学习方法和经典PID控制方法对倒立摆系统分别进行建模与控制实现,并着重对控制表现进行对比分析,结果表明在该控制任务中连续强化学习训练所得的控制策略对扰动的反应更迅速,并具有更强的稳定性.
其他文献
在这个日新月异的时代,颠覆传统的东西越来越多,汽车也在不断顺应这种潮流。曾经,我们将Coupe定义为造型优美、性能出众、实用性一般的双门轿跑车,但现在这种观念早已被颠覆,比如奔驰CLS,比如大众CC,再比如保时捷Panamera,这是大势所趋。事实上,我们测试的上海大众凌渡,同样在顺应这样的潮流,它就像奔驰CLS那样,让原本沉闷的轿车,摇身变成了仙女般妩媚动人。 理性与浪漫的融合 凌渡是上海大
当前大多数复杂控制系统的 目标是快速、高效、可靠地将系统控制至目标设定点.模型预测控制由于可以处理大型的受系统状态和输入严格约束的多变量系统而成为当前比较流行的控制算法.在工业生产过程中,信息和目的的分层方法不再是最佳或最理想的处理方式.最近提出的替代分层的方法是直接将经济目标作为控制系统的目标函数.在这种称为经济模型预测控制的方法中,控制器直接实时地优化过程的经济性能,而不是跟踪到设定值.其中设定值为由其他信息管理系统提供的最佳稳态设定点,该最佳稳态设定点通常是系统所有稳态中代价最小最有利可图的状态量.
近年来,现代冶金行业信息化迅速发展,对冶金产品过程质量要求越来越高,特别是对于附加值较大的上游产品,生产过程中就要对其质量数据进行收集和监管,对于钢管企业热轧区生产监督就显得特别重要.描述了钢管热轧区域过程控制系统设计和应用,通过对制造执行系统(MES)生产计划接收、控制系统生产过程质量数据收集、物料跟踪和生产过程管理等功能,实现了对钢管从短坯到成品生产过程追溯,采用“软”跟踪模式实现对钢管信息进行逐支跟踪.
核心指标打分212.5 厂商:北京现代 车型:ix25 代言明星:金秀贤(韩国) 通过《来自星星的你》,金秀贤成功塑造出高冷、傲娇、毒舌、腹黑的都教授形象,并因此大受追捧,风头一度甚至高过李敏镐。就在2014北京国际车展开幕前夕,北京现代看准风头正劲的“都教授”,与他签订了代言全新小型SUV ix25的合约。 ix25的定位正是时尚、自信且兼有责任感的“潮流个性青春一族”,车辆外观设计简
针对非标自动化测试中对视觉引导的电机控制需求,设计了一种基于LabWindows/CVI电机控制系统。首先,系统通过工业相机采集待目标图像,然后通过图像处理算法对目标进行识别与定位,最后,根据定位信息控制伺服电机运动至指定位置进行对象的移动等控制任务。实验验证,该系统是有效的。
针对火电机组湿法脱硫pH值核心控制子系统存在大滞后大惯性问题,采用带扰动抑制的广义预测控制方法,设计了脱硫pH值先进控制策略,基于该策略可实现pH值更优的设定值跟踪性能,同时保障更优的扰动抑制性能.通过与传统pH值串级控制系统仿真比较表明:所提先进pH值控制策略在设定值跟踪与扰动抑制方面,系统稳定性、快速性以及准确性方面均得到了更优的控制性能.算法简单易于工程实现,具有较高的工程应用价值.
针对上肢康复机器人在随动过程中反映出患者实际运动能力不佳的问题,提出了一种基于变导纳控制的上肢康复机器人柔顺控制方法.首先进行了机器人的机械结构说明,建立了用于机器人控制的运动学模型;其次通过在机器人末端安装六维力/力矩传感器获得外界的操作者交互力;再次,建立了基于标准驱动力的变阻尼导纳控制器以将交互力转化为机器人的输出速度;最后通过实际的路径跟踪测试验证控制方法的性能,结果表明提出的控制方法获得了低阻尼控制在任务耗时及高阻尼控制在运动准确性上的优势性能.
中国消费者的购车理念向来与众不同,无论是A0级还是D级,亲民定位还是豪华档次,后排空间都是任何车型在研发过程中不可忽视的一环,即便是以动感驾驶见长的车型也不能幸免。因此,国产与加长便成为了打包的套餐,制约着每一个进军中国车市的豪华品牌。 轴长车更长 48mm,一个成年人三根手指的宽度而已,但若要放在一款车的轴距上,却是一次革命性的提升。它的变化不仅可以用拳头来丈量,一个大大的“L”标识也会被张
将LabVIEW引入到单相电源适应能力检测系统的设计中,解决在对单相电源适应能力进行测试时,测量设置参数操作繁杂、测试全程无法监视,且存在试验过程无法可视化、试验结果无法追溯的问题.通过分析设备的通讯协议以及接口特性,通过LabVIEW对单相电源与上位机之间的通信,实现实时数据传输.在搭建好通讯后,采用生产消费模式对系统完成测试数据实时采集且可视化、储存测试过程数据等功能.通过该系统能够高效地实现单相电源的适应性测试,使测试过程更简便,测试数据可追溯,测试过程可视化.
针对当前时有发生的电力设备运维人员现场安全防护装备和操作不规范的情况,基于机器视觉已有研究成果,并在背景分割、目标跟踪和人体姿态识别算法等方面根据实际场景需求做了进一步的改进。现场测试表明,该技术方案能够较好地满足实际工作场景的需求,具备可实用化的准确率和响应速度。根据测试结果,提出了下阶段功性能研究和提升的方向。