【摘 要】
:
随着自动驾驶和人工智能技术的发展,无人物流车队在城市区域内的配送货物发挥了越来越重要的作用。针对传统算法在求解城市末端区域内无人物流车队配送中面临的时效性差,往往陷入次优解,配送规模扩大时间成本指数增加等亟待解决的问题,本文提出了一种改进的基于注意力机制和深度强化学习算法的方法,并将其应用于带时间窗的无人物流车队的配送路径规划问题和考虑区域拥堵的带时间窗的无人物流车队的配送路径规划问题。本研究面向
论文部分内容阅读
随着自动驾驶和人工智能技术的发展,无人物流车队在城市区域内的配送货物发挥了越来越重要的作用。针对传统算法在求解城市末端区域内无人物流车队配送中面临的时效性差,往往陷入次优解,配送规模扩大时间成本指数增加等亟待解决的问题,本文提出了一种改进的基于注意力机制和深度强化学习算法的方法,并将其应用于带时间窗的无人物流车队的配送路径规划问题和考虑区域拥堵的带时间窗的无人物流车队的配送路径规划问题。本研究面向城市“最后一公里”无人物流车队配送路径规划问题,以带时间窗的无人物流车队配送路径和考虑区域拥堵的带时间窗的无人物流车队配送路径成本最优化,用车数量成本最小化为目标,从人工智能的方向挖掘对城市区域物流车队配送问题的求解方法。通过遵守软时间窗约束和配送车容量约束,满足配送客户随机需求,完成对无人物流车队的配送路线规划。模型代表了一个参数化的策略和一个参数化的价值评判网络,应用强化学习算法基于序列奖励通过回合更新方式来训练优化模型。本文主要工作如下:(1)提出了一种改进的基于深度强化学习算法的注意力机制模型。该模型基于端到端的思想,一端是将带时间窗的物流车队路径问题输入训练好的模型中,另一端可以快速有效率的给出整个车队路线调度。通过设计深度神经网络模型,搭建强化学习状态信息融合模块、注意力机制模块和递归神经网络模块作为策略网络,搭建价值网络,设计奖励函数、状态转移函数、屏蔽函数,构建强化学习算法并应用该算法训练模型。(2)将搭建的基于深度强化学习算法的注意力机制模型应用于城市末端区域内无人物流车队配送的路径规划问题,重点研究了带软时间窗的无人配送车队在城市末端区域内的配送路径问题。为了提高模型收敛速度、求解效率、求解质量,本文通过对奖励函数不断调整改进,在奖励函数中加入相应惩罚;改进顾客节点屏蔽方案;优化强化学习状态转移函数等主要三个方面优化改进模型。(3)在上述研究的基础上,将区域拥堵因素加入带时间窗的无人配送车队配送路径问题,将基于深度强化学习算法的注意力机制模型应用于考虑区域拥堵的无人物流车队配送路径规划问题。通过对模型进一步修改和改进,增加模型对拥堵区域信息(拥堵半径,拥堵中心,拥堵强度)的信息处理,将其作为深度强化学习的状态考虑因素。数值实验表明,模型能够快速解决不同顾客节点规模的带时间窗车辆路径问题,特别是在顾客节点配送规模扩大时能够高效地给出良好的车队规划路线;在小规模问题的求解方面模型在采用贪婪解码策略时和遗传算法的解相差不大,但对于顾客规模扩大时本文模型表现相对较好,在路径成本和用车数量成本方面要优于遗传算法;通过对比顾客节点两种解码策略,分析发现训练阶段顾客节点采用随机解码策略,使得模型尝试探索更多解空间,有效避免陷入局部最优,测试阶段采用贪婪解码方式,可有效提高模型在车队总路径成本,车队数量规模,时间效率等方面的效果。此外,基于深度强化学习算法的改进模型能够快速高效率处理城市区域拥堵的无人车队配送路径规划问题。
其他文献
地热能是一种绿色低碳、可循环利用的可再生能源,具有储量大、分布广、清洁环保、稳定可靠等特点。我国地热资源丰富,市场潜力巨大,发展前景广阔。开发利用地热能不仅对调整能源结构、节能减排、改善环境具有重要意义,而且对培育新兴产业、促进新型城镇化建设、增加就业均具有显著的拉动效应。地热能通常分为浅层地热能、水热型地热能、干热岩型地热能。
随着华联商厦在北京市场画上句号,百货业态的发展前景也愈发引人深思,购物体验中心正探路未来。华联商厦在北京市场正式画上了句号。"华联商厦要改造升级,下午5点就要全部清场,我们的促销也只做最后半天,不然清货就来不及。"9月30日,位于华联商厦望京店一层的一家商户告诉《商学院》记者,"促销甩卖、打折已经持续一个月了,从打八九折到五折,有些商品直接一口价99元、199元、399元了。"
跨学科实践作业通过综合运用各学科知识,打破学科间的壁垒,丰富学习路径。与单一学科相比,跨学科实践性作业引领学生进行跨学科思维整合,以应对实际问题和解决复杂问题,引导学生在探索中形成独立思考、深入探究的能力,培养学生的创新思维品质。
为了提升防空体系执行OODA循环的速度和质量,在OODA环基础上增加评估(assessment)环节,提出一种基于OODA-A环的防空体系作战模型,该模型能够对防空体系执行一次OODA循环的战场态势变化情况,以及作战效果进行综合评估,包括对敌方目标机动情况和目标信息冲突情况、目标毁伤情况,我方武器漏射击和过射击情况、作战损耗情况等进行评估,并根据评估结果决定下一步行动方向,同时能够将评估结果实时反
危重症获得性肌无力(intensive critical unit-acquired weakness,ICU-AW)是重症监护病房(intensive care unit,ICU)的常见并发症,可继发于导致危重症的各种疾病及其治疗[1]。ICU-AW的患病率因研究人群、评估时机、诊断方法及患者入院前基础肌肉功能不同而有很大差异。31项研究的中位患病率约43%[2]。其典型的表现为广泛的、对
随着基础教育课程改革的深入推进,跨学科教学给教育工作者带来了新的挑战。本文以美国"飞向火星" STEM课程作业为素材进行案例分析,主要介绍该作业系统的目标导向、主体设计、实施策略及评价体系,以期为其他教育工作者开展跨学科作业设计提供新思路。
为满足我国石油资源利用需求,必须做好消防安全管理工作,全面发挥消防安全管理制度的内在优势,促进我国石油化工行业健康发展。本文分析了石油化工企业常见火灾事故的基本属性与发生规律,并指出了石油化工企业现有消防安全管理制度的缺陷,总结了做好消防安全管理、消除潜在安全风险的正确措施。
文章以作业研究项目基地校的有效尝试为出发点,从应需而"跨"、应时而"跨"、应景而"跨"三个维度探索开展小学跨学科作业设计与实施。
以运输贸易为导向的经济发展原则,符合中国经济的长远发展利益。而疫情虽然令全球供应链的问题凸显,但也加速了可视化线上货运平台的发展速度,对于全球货运物流从业者来说,危机中也存在巨大的机遇。我们不仅需要从政府层面出台相关政策、财政拨款倾斜,企业层面也需要调整自身战略,增强相互合作,以客户多元化为导向,群策群力,解决当前运输服务贸易存在的问题,构建完善体系,提升国际影响力。
[目的]分析2012-2018年我国中医药财政投入的区域差异、投入产出效率变化及影响因素,以期为政府合理配置中医药资金,提高财政投入的公平性和效率,为促进中医药事业稳定发展提供参考依据。[方法]运用泰尔指数测算中医药人均财政投入量以评价中医药财政投入公平性,运用DEA-Malmquist指数评价中医药财政投入产出效率。[结果]2012-2018年中医药财政投入总泰尔指数介于0.0428~0.055