基于改进RMSProp-PPO算法的铝电解参数寻优模型

来源 :电子元器件与信息技术 | 被引量 : 0次 | 上传用户:gxp_crysta1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对铝电解过程中参数调控没有科学的标准问题,本文探索了利用深度强化学习训练智能体,代替工艺人员对铝电解过程进行参数控制的离线设计方案.建立了铝电解过程中多个参数的寻优模型.选择基于改进RMSProp的近端策略优化算法(Proximal Policy Optimization,PPO),利用其与环境交互、根据奖赏改进策略选择的机制,学习铝电解过程中的规律,输出最优参数值,为工艺人员实际生产过程中调控参数提供参考标准.为验证最优参数可靠性,本文将实验结果应用于某厂单槽连续一个月的生产中,实验结果表明,改进的RMSProp-PPO具有更快的收敛性,同时参数寻优结果具有一定的可靠性和指导意义.
其他文献
针对污泥烘干量日益增加的问题,在污泥烘干监控系统中引入边缘计算技术,通过“实时+预测”协同控制的方法来提高污泥烘干机的工作效率.通过仿真实验,基于Keras训练的深度神经
近几年,我国的高新媒体技术迅速发展,数字卫星电视便是其中之一.数字卫星电视将太空中的地球同步卫星作为电视信号的传输源来进行电视台电视信号的接收,再将其传送到用户家中
我国已经步入了信息时代,在这样的情况下,随着Internet信息技术的不断发展、更新和普及,网络安全技术问题引起了人们的关注,在实际的网络信息技术中形成并存在着许多风险.因
office文档的排版操作是大学生必需要掌握的一项基本技能.通过对目标文档格式分析检查学生对这一技能的掌握程度.文档排版格式的自动分析可以有效提高格式分析的效率.格式信
覆冰是影响架空输电线路安全稳定运行的重要因素,对架空输电线路覆冰进行实时在线监测可及时发现覆冰的产生并掌握覆冰发展趋势.北斗导航系统已实现对全球范围内用户提供实时
针对海量视频库,传统方法检索目标人物视频片段仅仅采用视频帧的全局特征进行匹配,导致对视频帧中的变化无法兼顾,无法准确检索人物视频。因此提出了人脸识别和改进的K-means聚类相结合提取关键帧的方法。首先,利用多任务卷积神经网络从视频帧的不同角度检测人脸并保留置信度,然后提取人脸特征,对提取的人的面部特征用置信度进行加权,最后,用改进的K-means聚类方法提取关键帧进行视频检索。该方法获取的关键帧
面向电热毯面料的缺陷检测场景,基于AI深度学习算法分析的智能视觉检测系统,实现全自动高效率高准确率的多类型面料瑕疵检测。针对电热毯生产的全流程质量管理要求,该智能检测系统以人性化、可视化的操作界面,全面展示面料的多维度生产质量数据化指标,并自动将瑕疵面料按照产品质量管理要求进行智能分类,轻松实现电热毯面料产品的智能自动化质量检测;该系统运行将大幅降低原人工检测工艺流程中的质量检测人工工作量及成本,
党政军、企事业单位均已组建自己的专用计算机网络,大量的工作及业务依赖于它.计算机网络组建依赖于路由器、交换机、防火墙等设备,现有设备使用的系统结构、芯片体系大致相
随着光伏发电工程项目建设规模日益扩大,光伏发电并网容量也在不断提高.要积极完善光伏并网项目工程质量管理的方法,严格保障工程质量.光伏并网工程项目包含的要点众多,需充
探讨基于云计算技术的药学实验室教学资源共享平台设计与构建.对云计算共享平台的架构、功能需求、平台的结构进行分析.通过云计算技术的平台搭建,实现了药学实验教学资源的