【摘 要】
:
针对任务随订单动态到达环境下的纺织面料染色车间动态调度问题,以最小化总拖期时间为优化目标,提出了基于多智能体循环近端策略优化(Multi-Agent Recurrent Proximal Policy Optimization,MA-RPPO)强化学习的完全反应式调度方法。首先,针对染色车间调度的组批和排缸两个子问题,设计了组批和排缸两个强化学习智能体;接着,针对车间任务的动态性,引入长短期记忆网
【基金项目】
:
.国家重点研发计划资助项目(2019YFB1706300); 东华大学青年教师启动基金资助项目;
论文部分内容阅读
针对任务随订单动态到达环境下的纺织面料染色车间动态调度问题,以最小化总拖期时间为优化目标,提出了基于多智能体循环近端策略优化(Multi-Agent Recurrent Proximal Policy Optimization,MA-RPPO)强化学习的完全反应式调度方法。首先,针对染色车间调度的组批和排缸两个子问题,设计了组批和排缸两个强化学习智能体;接着,针对车间任务的动态性,引入长短期记忆网络(Long Short-Term Memory, LSTM)提取车间动态信息,提高智能体对动态环境的自适应能力;进一步提出组批智能体和排缸智能体的交互机制,实现组批与排缸全局优化;最后,抽取问题约束与优化目标的相关特征并设计奖励函数,通过动态调度机制驱动智能体的交互学习获得最优调度策略。经某印染企业的实例验证表明,所提方法对不同规模问题的求解性能均优于多种常用的高性能启发式规则,有效降低了产品的总拖期时间,提升了企业订单的准时交付能力。
其他文献
<正>引言在初中英语教学过程中,教学单元由于是承载主题意义最为基本和最为完整的单位,因此每一个英语教学单元都会围绕着相关的主体进行编排,才能使学生在学习过程中和教师教学过程中实现逐层递进的目的,从而符合教育教学认知和规律的需求。基于此,文本就单元整体教学视角下初中英语教学设计的应用进行深入分析,为初中英语教育教学提供必要的参考借鉴。
初中英语教学既要重视基础知识的落实,也要重视以素养为立意实现教学目标,开展基于主题意义的单元整体教学。主题意义引领下的单元整体教学应先依据课程标准,分析单元内容,提炼单元主题意义,然后依据学情并围绕单元主题意义制订单元教学目标与课时教学目标,在此基础上践行英语学习活动观设计教学活动,引导学生基于对各语篇内容的学习和主题意义的探究,逐步建构和生成围绕单元主题的深层认知、态度和价值判断,促进学生核心素
建设国际消费中心城市对推动重庆高水平对外开放和经济高质量发展具有重要意义。本文依据建设国际消费中心城市的国际知名度、消费繁荣度、商业活跃度、到达便利度和消费舒适度等维度标准,研究发现重庆建设国际消费中心城市已具备战略地位日趋凸显、消费环境持续向好和综合实力稳步上升等基础优势,但仍存在国际影响力较弱、人均消费水平相对偏低等现实瓶颈。鉴于此,本文从优化功能空间布局、促进区域协同创新、完善城乡消费网络、
双足机器人形态拟人,具有多关节的结构,已经在灾害救援、商业表演、家庭娱乐等领域投入使用,得到了研究者的广泛重视。近几年来,许多研究者投身于深度学习结合强化学习在双足机器人上的应用研究。然而大多数的研究依然停留在较为简单的步行运动控制上,无法充分挖掘双足机器人多关节的潜力和发挥深度强化学习算法的训练优势。强化学习,结合深度学习的表征能力,可根据机器人与环境进行互动产生的数据进行不断地优化与学习,从而
传统的通信设备仿真配置系统易受到外界攻击,造成通信信息易被篡改的问题。针对这一问题,该文设计了新的电力物联网分布式通信设备仿真配置系统。在系统硬件部分应用ST7538电力载波芯片,并将AT82RM7500单片机作为核心,建立100 M以太网接口,实现信息的高效传输。采用电磁式继电器控制电路的通断,并在液晶屏上显示通信结果。在系统软件部分,以最短传输周期为目标,设计物联网分布式通信数据的防篡改流程,
<正>《义务教育英语课程标准(2022年版)》倡导践行英语学习活动观,秉持在体验中学习、在实践中运用、在迁移中创新的学习理念。那么,英语作业作为课堂教学之外的一种有意义的探究活动,它是学生学习活动的一部分,是课程和教学的有机组成,作业设计同样可以体现主题意义的引领,从学习理解、应用实践、迁移创新三个层次设计,体现综合性、关联性、实践性等特点,英语作业设计应当摒弃唯智主义,指向学生核心素养的发展。
目的 倡导将茶马古道元素运用到出口茶叶包装设计中,并通过对字母文字的汉字式设计,使中国文化和茶道精神随出口茶叶得以广泛传播,提高出口茶叶产品文化附加值,进一步拓展茶叶出口市场。方法 通过分析证明茶马古道元素运用对出口茶叶包装表现中国文化和茶道精神的代表性作用;通过反思现阶段出口茶叶包装的不足与面临的困境证明出口茶叶包装设计中对字母文字的汉字化设计具有重要意义;通过分析中西文字形式差异总结字母文字汉
为解决数量不定的同构水面无人艇(USV)集群以期望队形协同集结的问题,提出了一种基于多智能体深度强化学习的分布式控制方法。首先,针对USV通信感知能力约束,建立集群的动态交互图,通过引入二维网格状态特征编码的方法,构建了维度不变的智能体观测空间;其次,采用集中式训练和分布式执行的多智能体近端策略优化(MAPPO)强化学习架构,分别设计了策略网络和价值网络的状态空间和动作空间,定义了收益函数;最后,
近年来,我国高度重视并稳步推进课程思政建设。物流管理各专业课的思政课程建设以兴趣点和切入点为着力点、精心设计思政元素并将之融入到专业建设和教学工作中,精心搜集思政案例,以实现“润物细无声”的思政引导。本文以《智能仓储管理》课为例,研究物流管理专业课程思政的建立和实施,提倡过程评估和成果评估互相融合、教师评估和学生自评有机结合、定性评估和定量测评有机结合的课程思政实施模式。