基于强化学习的批处理机生产与运输协调调度研究

来源 :沈阳理工大学 | 被引量 : 0次 | 上传用户:junr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在智能工业体系下,生产与运输协调已经成为生产系统中最为重要的一环。企业生产过程具有工序繁多复杂、能耗高以及环境要求严格等特点,这使得合理地安排工序间的运输变得尤为重要。为了缩短生产时间、降低能耗,使得企业既能响应国家智能工业的政策,又能符合绿色环保的要求,本文主要针对生产与运输协调进行深入研究。本文以钢铁企业为研究背景,针对生产过程中时常含有高温作业运输等特点,提炼出两个带高温运输与带批生产的协调调度问题进行研究。已知运输与生产协调调度问题被证明是NP难问题,在求解过程中存在维数灾难。因此,采用强化学习算法分别对两个问题进行求解。本文主要研究的内容如下:(1)针对单个批处理机环境,考虑多台运输车进行生产前运输,考虑车辆和机器容量限制。工件动态到达运输区后等待运输,运输到生产区等待批处理机生产,批处理机可以同时加工多个工件作为一批。每批工件的加工时间为批次工件中加工时间的最大值,以总完工时间最小为目标,建立两阶段协调调度的模型。根据问题中车辆和机器忙闲程度、工件实时信息来定义状态特征,将调度规则作为动作,根据问题目标定义奖励,实现问题的转化。针对状态连续且空间过大的问题,采用了函数逼近的方法对Q-Learning算法进行改进,并对转化后的问题进行求解。实验结果表明了算法具有较好的稳定性和可行性。(2)针对多个批处理机环境,多台车进行运输,设置车辆容量为1,带机器容量限制等约束,考虑机器在线时间,工件动态到达等待运输,运输完成后分配组批进行加工,以总完工时间为目标,建立混合整数规划模型。然后从车辆、机器和工件的状态实时变化来定义状态特征,选择调度规则作为动作,以问题目标设计奖励函数,完成问题的转化。最后针对存在状态特征连续的情况下提出了线性值函数逼近的强化学习算法对问题进行求解。实验结果表明,该算法对于求解生产与运输协调调度问题具有良好的稳定性和有效性。
其他文献
随着风电并网规模不断增大,主动配电网的动态电压稳定性和动态供电质量问题日益突出。永磁直驱风机的动态特性与电网交互作用对电力系统稳定存在重要影响,风电场中越来越多的
<正> 随着国内新的8英寸线的不断建设,不少人对6英寸线的前景表示关注。6英寸线是否还有市场?本文就是试图通过对中国国情的分析、对半导体产品的分析与设计公司的分析等等来
纳米尺度的高分辨功能性结构在微电子器件、等离激元光学、生物传感等领域有着重要的应用。但是如何更加高效地加工出更高精度的功能结构一直都是研究人员所关注的问题。常规
近年来,我国很多城市雾霾天气日益加剧,对人们的生活及身心健康造成了极大的危害,由于雾霾发生时同时会伴随着水汽、风力、温度等气象因素的变化,因此我们可以通过监测大气中
脉动热管作为一种高效传热元件,在电子期间冷却、空间、核能、太阳能等领域具有巨大应用潜力。其在不同应用领域,加热与冷却工况不同、工作温度区间不同,基于此,研究了冷却水流量和温度对板式脉动热管传热性能的影响。同时,将脉动热管应用于太阳能集热,研究了低温和中温冷却条件下聚光式脉动热管太阳能集热器运行特性及吸热过程。主要研究内容和结论如下:(1)通过搭建脉动热管传热性能实验系统,研究不同冷却水流量对脉动热
目的观察他扎罗汀凝胶治疗寻常痤疮、扁平疣的疗效及不良反应.方法每晚清洁面部后取他扎罗汀适量薄涂于患处,每周复诊一次并进行记录,连续4周后进行疗效评估.结果两组50例中
当今世界已经进入大数据时代,大数据所带来的信息风暴正在变革我们的生活、工作和思维。审计环境随着大数据时代的到来出现了很大的变动,审计工作的难度加大。从财政审计角度来说,随着金财、金税、金保等工程的发展,不仅涌现出大量的信息,而且系统数据层出不穷,审计人员一直采用的人工审计方法以及现场审计软件表现出显著的滞后性,难以应对繁杂的审计工作。由此可见,必须在财政审计工作中应用大数据技术,这样才能提高财政审
GPS测绘技术主要是由卫星定位系统给测绘工作提供定位测量的坐标依据来进行测绘工作的一种技术,应用GPS技术进行工程测绘的效果非常好,既具有极大的准确性,也有助于测绘人员
总结30例脑动静脉畸形患者术后并发症的观察及护理。做好正常灌注压突破综合征、脑灌注不足、癫痫、弥散性血管内凝血(DIC)的预防与护理,提高患者救治成功率。