深度强化学习在批调度问题中的应用与研究

被引量 : 0次 | 上传用户:meng8500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
批(处理机)调度问题从半导体测试工艺中启发而来,是生产调度的热门研究方向之一。不同于传统机器,批处理机只需要满足容量约束,就可以同时加工多个工件。当前,传统方法在求解批调度问题时存在一定的局限性,而深度强化学习在解决各类复杂的组合优化问题中展现出优异的应用性和强大的泛化性。因此,本文从两类单机批调度问题出发,研究了深度强化学习求解批调度问题的有效性。论文的主要工作如下:第一,研究了考虑动态到达的差异工件批调度问题,以最小化制造跨度作为优化目标。首先,根据问题的约束条件建立了数学模型。然后,将批调度问题抽象为序贯决策问题,提出了一种基于深度强化学习的分批优化算法。该算法引入了指针网络构建网络模型进行序贯决策,利用启发式规则协助指针网络解决工件分批,采用Actor-Critic算法对指针网络进行训练。为了进一步提高指针网络的求解性能,本文提出了多约束组批机制来改进指针网络中的指向机制,达到缩小可选工件集并解决工件分批的效果。仿真实验验证了所提算法的有效性,其中基于多约束组批机制的算法整体表现最好。第二,研究了考虑交货期的差异工件两目标批调度问题,以最小化制造跨度和最大迟滞时间作为优化目标。首先,基于问题描述建立了数学模型。然后,利用加权和方法将两目标批调度问题分解为一组单目标子问题,采用指针网络构建子问题的网络模型进行序贯决策。为了有效的提取批调度问题的深层特征,引入了多头注意力机制构建Critic网络。最后,采用传统NSGA-II算法作为对比算法,实验结果证明了所提算法的有效性。
其他文献
以汉中为枢纽的古蜀道,北接秦川,南通巴、蜀。"天梯石栈相钩连"道出了其交通的艰难程度。它在中国古代交通史上地位特殊,在世界古代交通史中也灼灼发光,夺目耀眼。本文论述蜀道与蜀汉政权的关系,认为蜀汉立国的地理条件主要在于四塞险固。汉末,刘焉为了割据益州而派张鲁、张修袭夺汉中并封闭了北蜀道。三国蜀汉政权前期加强了对北蜀道的管控,中期对北蜀道的利用不及曹魏,后期则疏虞了防御体系的建设,导致钟会伐蜀长驱直入
会议
报纸
使用STM32单片机和DDS芯片AD9833相结合的方法,为工业现场设备测试设计了一个双通道输出且频率、幅值、电压信号、电流信号均可调节的基准信号源.以STM32作为控制核心,控制AD9833可输出频率5 Hz~40 kHz可调的高幅值正弦波、方波、三角波、锯齿波波形;以STM自带的DAC模块得到4~20 mV电压信号、4~20 mA电流信号输出.对PLC与过程仪表、电动阀门等设备进行调试和检测,
期刊
文章在原有三相两电平的逆变器结构的直流母线上增加了两个开关管,使得共模电压在零矢量作用时得到了消减。同时在Matlab/Simulink中搭建三相永磁同步电机(PMSM)矢量控制的仿真模型,基于此模型研究了无零序矢量脉宽控制(NZPWM)减少共模电压幅值的控制策略。通过不改变传统空间矢量脉宽调制(SVM)策略,构建了一种逆变器的拓扑结构使得零序矢量作用时无共模电压产生。结合理论与仿真分析,并与SV
期刊
报纸
<正>安全是民航业的生命线。民航安全,或者说民用航空器飞行安全,关乎国家安全和社会稳定,关乎人民生命与财产安全,关乎民航快速发展。作为民航高质量发展的基本特征和支撑一切成绩及目标的基石,民航安全的极端重要性已上升到了新高度。截至2019年底,运输航空实现连续安全飞行112个月、8068万小时,运送旅客42亿人次,
期刊
充分发挥可调控资源群体的调控特性,可以极大提升地区电网动态调节能力。为此,文中提出一种面向可调控资源群体的协同优化调度方法,并利用多智能体深度强化学习技术求解多群体复杂协同问题。首先对考虑多可调控资源群体的地区电网优化调度问题进行建模,设定电网优化目标及系统安全运行约束等条件;其次,阐述多智能体深度确定性策略梯度算法基本原理;然后,利用策略梯度更新算法,进行“集中训练-分散执行”寻求可调控资源群体
期刊
报纸
深度强化学习在智能制造领域具有广泛的应用前景。文章概述了相关文献的综述,总结了深度强化学习在智能制造领域的几个主要应用方向,如自动化控制、智能优化调度、故障预测与维修、品质控制与质量预测以及智能物流和供应链管理。在这些领域,深度强化学习利用深度学习网络和强化学习算法,能够实现更高效、更精准、更智能化的制造过程控制和管理。同时,探讨了深度强化学习在智能制造中面临的挑战和未来发展方向。这些研究对推动智
期刊
汽车的发展是现代工业技术最重大的成就之一,汽车在满足人类生产、生活流动性等需求上做出了重大贡献,它促使了工业社会的进步。然而,汽车在全世界大规模的应用已经产生并持续引发环境污染、全球变暖以及石油资源迅速减少等问题,这些方面逐渐成为人们关注的焦点,新能源汽车的研发和应用已成为世界各主要工业国家针对环境和能源问题推出的解决方案之一。电机控制器、电池管理系统和整车控制器是纯电动汽车的三大主要控制系统。电
学位