面向限量弧路由问题的深度神经网络算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:cjc013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
限量弧路由问题(capacitated arc routing problem,简称CARP)是一类有挑战性的复杂组合优化问题,在现实世界中有着广泛的应用,如市政服务、物流运输、城市垃圾回收、电力线路检查、自动引导车路径规划。在过去数十年的研究中,启发式算法被主要用来求解限量弧路由问题。然而,对于给定的一个待求解的限量弧路由问题样例,大多数启发式算法需要从零开始进行迭代搜索来寻找问题的解。这一过程往往非常耗时,因此现有的启发式算法难以被应用到一些需要实时求解的问题场景中。受近几年快速发展的深度学习研究的启发,本文提出了一种全新的范式来求解限量弧路由问题。预先通过大量的问题样例训练得到的深度神经网络模型作为神经求解器。在新的待求解的问题样例上,求解过程将转化为耗时很低的神经求解器的测试过程。对比启发式算法,神经求解器的目标是在允许小幅度损失解的质量的范围内,极大地提高求解速度。本文针对这一目标展开研究,提出了两个不同的CARP神经求解器。本文首先提出了一个基于序列到序列模型和采用监督学习进行训练的神经求解器。问题样例和启发式算法在对应样例上给出的解作为输入和标记值来构造产生每一个训练样本。通过图嵌入和预排序方法,每一个样本中的输入和标记值被构造为两个序列,限量弧路由问题的求解过程即被转化为一个序列到序列(sequence-to-sequence,简称seq2seq)的预测过程。该方法采用一个编码器-解码器模型(encoder-decoder)作为神经求解器来完成序列到序列的映射,并使用监督学习训练这个模型。通过监督学习,启发式算法在历史数据上的求解经验被转移到神经求解器内,在一定程度上保证了解的质量。鉴于有标记的数据在一些场景下难以获得,本文提出了一个基于集合到序列模型和采用强化学习进行训练的神经求解器。强化学习将最大化累积奖励作为训练目标,不需要额外准备有标记的数据。在该方法中,引入图卷积网络(graph convolutional network,简称GCN)模型和两个编码器-解码器模型将限量弧路由问题的求解过程转化为集合到序列(set-to-sequence)的过程。整个模型被参数化为一个生成有效解的策略。通过将执行策略得到的解对应的代价函数值映射为奖励信号,并使用经典的REINFORCE算法优化策略中的参数,神经求解器能够学习到有效地求解方法。实验结果验证了这两种方法在产生的解不明显差于启发式算法的情况下,求解速度可以得到显著的提升。
其他文献
当前我国糯玉米主要用作鲜食,但生产上应用的糯玉米品种符合鲜食要求的不多,育种者在品质性状方面不够重视,研究较少,从而影响了糯玉米的食用品质、商品价值和产业化发展。对
20世纪西方符号学的代表人物之一克里斯特瓦提出的“文本即生产力”是一个复杂的命题。本文介绍、阐释并分析了这一命题下的许多概念,然后在总体检视批评的基础上,提出了对克氏这
张秋生的童话深受中国文化的浸润,体现出中国式的艺术精神,在自然、清新、流畅中含而不露地蕴蓄着精神性、教育性的价值追求。《小巴掌童话》虽然篇幅短小,却内蕴丰厚,融诗歌、散
高校学生干部是连接学校与普通同学的桥梁和纽带,学生干部素质的高低直接影响到学校的学风和校风。笔者从事多年学生干部管理工作,在工作中不断探索,建立了一套行之有效的学生干
目的通过髌周韧带的松解治疗髌骨不稳定症的临床疗效观察,探讨其作用机理和临床治疗。方法随机将筛选的30例髌骨不稳定症患者分为两组,分别为针刀松解治疗髌骨不稳定症组和针灸
浅论五四时期马克思主义与无政府主义的论战李妍本世纪20年代关于马克思主义与无政府主义的论战,是中国近现代史研究领域的一个重要课题。以往史学界对此专题论述较多,成果颇丰。
种族差异的分析和评价是药物评价重要内容,本文结合人用药品的注册技术要求及国际协调会议E5指导原则等及近年来对进口药品和国际多中心药品的审评实践,就药品评价中如何考虑
旅游资源作为一种潜在的自然资源.一但被人们合理地开发利用,它将会给一个国家或地区带来不可估量的经济价值。经源县是一个经济很落后的贫困县,人均占有耕地面积不足2亩,农业的
随着大数据的兴起,数据量出现了爆发式的增长,虽然带来信息的多样性,但同时也增加了数据收集、分析工作的难度,新环境要求新思维,竞争情报在大数据环境下的转变思维,成为竞争
目的探讨单隧道同种异体肌腱移植重建内侧髌股韧带(MPFL)治疗髌骨不稳的手术技巧及临床疗效。方法回顾性分析2010年6月至2012年1月广州军区广州总医院采用膝关节镜监视下单隧道