深度强化学习求解柔性装配作业车间调度问题

来源 :华中科技大学学报(自然科学版 | 被引量 : 0次 | 上传用户:pptcwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对产品动态到达的柔性装配作业车间调度问题,以最小化总拖期为目标,构建了基于事件点的数学规划模型,该模型包含加工机器分配、加工工序排序、装配站分配和装配工序排序四个决策序列,并提出了一种基于多智能体的深度强化学习算法进行求解.首先,所提出的算法包含四个智能体分别对应四个决策序列,智能体之间采用价值分解网络(VDN)协作策略;然后,构建基于拖期的复合回报函数,提取生产系统指标作为全局特征,完善各智能体的调度动作;最后,设计了精英经验库,充分挖掘高回报样本的价值.案例结果表明所提出的方法在不同场景下都优于现有经典调度规则和元启发式算法挖掘的调度规则.
其他文献
固定床加氢精制对煤液化油具有明显的稳定和改质作用,研究煤液化油中含硫化合物分布形态与加氢脱除规律有利于推动煤化工清洁油品技术发展并实现煤化工产品技术升级,其动力学研究可为加氢反应器设计、新型催化剂开发提供理论指导。采用气相色谱-脉冲火焰光度检测器(GC-PFPD)对煤液化油进行不同类型含硫化合物组成分析,研究反应条件对加氢总脱硫率、不同类型含硫化合物脱除的影响,并基于加氢脱除速率差异对煤液化油的脱
【目的】为新疆灰枣品质评价提供参考。【方法】从新疆南疆16个主产县(市)47个乡(镇)的代表性枣园采集148份灰枣样品,进行果实外观品质和营养品质的测定和综合比较。通过主成分分析和聚类分析,筛选出评价综合品质的关键性理化指标,运用层次分析法确定各指标权重,采用灰色关联度法对灰枣果实品质进行综合评价,并根据各产地果实的综合得分对其进行排序。【结果】不同产地间灰枣各品质指标存在差异性,库尔勒市灰枣的糖
传统的灰狼优化算法(Grey Wolf Optimizer,GWO)具有参数少、易实现及收敛快等优势,但也存在易陷入局部最优解及收敛精度低等不足,制约了其在工程领域中的应用。为此,本文提出一种双引导机制的灰狼优化算法,主要内容有:1.提出双引导机制灰狼优化算法(Two Guidance Mechanizms Grey Wolf Optimizer,TGMGWO)。首先,受粒子群优化算法的启发,将个
目的 分析体外受精/卵胞浆内单精子注射-胚胎移植(IVF/ICSI-ET)实验室因素对子代出生性别比(SRB)的影响。方法 回顾性分析2010年1月至2019年12月在我院行IVF/ICSI-ET治疗并成功妊娠分娩患者(共19 844个周期)的SRB情况。辅助生殖技术(ART)的主要实验室因素包括受精方式、移植胚胎类型、移植胚胎时期和移植胚胎数目等,故根据不同的受精方式分为IVF组(n=14 62
学位
目的分析某社区2型糖尿病患者自我管理水平及其影响因素。方法选取2019年1月至2020年12月在北京市朝阳区黑庄户社区卫生服务中心就诊的200例2型糖尿病患者作为研究对象,共发放200份调查问卷,收回有效问卷180份。采用自制的"一般情况调查问卷"收集患者的一般资料,使用糖尿病患者自我管理知识态度和行为评价量表对患者的自我管理能力进行评估,应用logistic回归分析影响2型糖尿病患者自我管理水平
卫星激光通信具有通信容量大、抗干扰性强、质量轻、保密性好等突出优势,得到广泛的研究与应用。卫星激光通信链路的建立与保持,主要由捕获、跟踪、瞄准(Acquisition,Tracking,Pointing,ATP)系统性能决定。其中卫星平台振动是影响ATP跟踪瞄准精度的主要原因之一。为抑制平台宽频抖动带来的误差,需要具有高速、高精度处理性能的精跟踪系统。传统精跟踪控制系统主流处理器为DSP、PC10
学位
人工智能等技术的发展驱动“互联网+教育”迈入新时代,加上新冠肺炎疫情的常态化存在,在线开放课程平台作为网络学习形态的典型场所,承载着大规模教学的责任。尽管在线学习课程以大规模开放形式呈现,但学习者的个性化学习仍必不可少,人工智能的发展为其提供了实践可能性。从学习者、教师和机器三者间的关系出发,探索并提出基于人机协同理念的在线开放课程平台在个性化学习目标确定、个性化学习内容生成、个性化动态学习过程干