论文部分内容阅读
在竞争日益激烈的制造业环境下,为了快速地响应顾客的个性化需求,从而获得利润和取得市场竞争优势,越来越多的制造型企业将面向订单生产(Make-to-Order, MTO)的生产模式应用到了现代化生产中。针对MTO企业订单接受决策过程中的不确定性,研究如何对订单的收益和其带来的一系列成本进行权衡,从而选择性的接受订单,以最大化MTO企业的长期利润这一问题具有很好的理论价值和实际应用价值,已经引起了企业界和学术界的广泛关注。从现有情况来看,针对不同订单及MTO企业的特征,许多学者提出了解决订单接受决策问题的模型和方法,可以给出较好的订单处理策略,但是已有研究大多假定市场需求是静态确定的,较少研究随机动态环境下的订单接受问题,并且较少将顾客等级、延期惩罚成本以及MTO企业生产能力限制等因素进行综合考虑。此外,已有模型和方法难以针对复杂不确定的现实环境给予准确建模,且模型求解是NP-hard的,也较少针对MTO企业订单接受决策支持系统进行研究。可见,对于MTO企业订单接受决策问题仍需要做进一步深入的研究。已有研究成果表明,强化学习不需要对环境进行显示的建模,适合于解决随机动态环境下的复杂序贯决策问题;而多Agent技术与Web服务技术的结合,可以为订单接受决策支持系统的实现提供有效的机制和理想的解决方案。因此,基于强化学习的MTO企业订单接受决策及订单接受决策支持系统的设计与开发问题,是一个值得关注的、具有现实意义的研究课题。鉴于此,本文开展了相关研究,主要完成的工作包括以下四个方面:(1)提炼了随机动态环境下,综合考虑有限订单特征及MTO企业生产能力限制等因素的订单接受问题。针对已有研究的不足,本文在综合考虑生产成本、延期惩罚成本以及拒绝成本等前提下,引入顾客等级这一要素,提炼出了更加符合现实需要的随机动态环境下的MTO企业订单接受问题。(2)给出了基于强化学习的MTO企业订单接受决策模型及求解方法。针对本文研究问题,结合强化学习的思想,构建了基于半马尔科夫决策过程的订单接受决策模型,并提出了基于SMART算法的订单接受决策模型求解方法。(3)通过仿真验证了基于强化学习的MTO企业订单接受模型及求解方法的可靠性和有效性。首先,在三种不同情境下,验证了基于强化学习的订单接受策略表现均优于基于先来先服务(FCFS)的订单接受策略;其次,通过对是否考虑顾客等级的两种情境进行对比,验证了引入顾客等级这一要素的必要性和重要性。(4)通过将基于强化学习的MTO企业订单接受决策方法嵌入到多Agent系统中,设计和开发了MTO企业订单接受决策支持系统(Order Acceptance Support Decision System, OA_DSS)。本文基于多Agent技术与Web服务技术,在给出订单接受决策支持系统的详细设计及实现的关键技术的基础上,使用Eclipse等开发软件,实现了OA_DSS的原型系统。本文提出的基于强化学习的MTO企业订单接受策略和开发的MTO企业订单接受决策支持系统,可以更好的辅助决策者快速准确的响应顾客订单请求。此外,本文的研究丰富和拓展了订单接受决策的相关研究内容和方法,可以为进一步开展相关研究工作提供有益参考。