基于强化学习的动态旅行商问题求解技术研究

被引量 : 0次 | 上传用户:luoqh163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
组合优化问题是计算机科学与运筹学中一个重要的问题,其在物流、生产调度、资源分配和社交网络等领域应用广泛。由于该问题具有重要的理论价值和应用前景,一直以来受到学者的广泛关注。旅行商问题是组合优化领域中一个典型的NP难问题,传统的旅行商问题考虑确定的客户集并已知客户之间的运输距离,其优化的目标是找一个从仓库出发访问每个客户仅一次并回到仓库的最短路径序列。包含随机因素的动态旅行商问题是更为一般化的问题形式,在传统问题形式中加入了影响路径规划的随机因素,例如动态的旅行时间和动态的客户需求。事实上,动态随机的旅行商问题更贴近实际应用,因此相比于静态问题它更具有研究价值和实际应用性。本文提出了一个基于强化学习构建的模型并用于求解包含随机客户的动态旅行商问题。在标准旅行商问题的基础上,本文假设客户的需求是动态变化的,每次求解只有部分客户有配送需求,而所规划车辆路径只需访问有需求的客户并使路径花费达到最小。该问题模型可以刻画物流企业中的日常配送问题,在该类问题中客户相对固定,但每天所需要配送的客户集合不完全一致,路径的规划需反复求解相近的问题。车辆路径规划模型主要由两部分构成:第一部分基于启发式算法在各随机节点问题上的求解数据,采用分段聚类算法将所有节点分割成若干个类簇,以此作为强化学习方法中状态表示和动作选择的基础。第二部分基于随机生成的动态实例应用Q-Learning算法训练模型,采用Res Ne Xt网络架构结合空间注意力机制作为模型决策网络,并用于决策类簇间的访问序列,而类内待访问节点序列采用2-OPT算法进行优化,最终得到动态问题的策略序列。本文将所提出的模型架构称为DTSPSC-RL,在对模型进行训练后,DTSPSC-RL可以反复求解节点数量动态变化的旅行商问题,无需对每个问题实例重新训练模型,从而达到了有效解决物流企业日常配送问题。基于上述模型,本文从离线决策和在线决策两个方面分别给出了相应的求解方案,离线决策指在执行计划之前计算解决方案的方法,在车辆出发前已知本次需要服务的客户对象集合,基于DTSPSC-RL规划访问路径以求解包含随机客户的动态旅行商问题。在线决策指在动态事件发生时立即计算解决方案的方法,在车辆出发前已知部分具有需求的客户对象,而另一部分客户的需求在车辆配送过程中才被提交,本文在DTSPSC-RL的基础上,提出了一种在线路径调整方法以实时求解包含随机客户的动态旅行商问题。
其他文献
本文针对南京白局当下所遇到的困境,如艺术魅力的日渐衰微、传承人才的青黄不接、传承与创新的关系问题等进行探讨,并试图从认知到理论再到实践中寻求突破口,以探索化解问题。本文主要从南京白局传承与创新的根本前提、重要依据以及主要途径等方面进行论述,特别在主要途径方面进行了分析。
期刊
在高速公路施工建设中常会遇到软土路基,其形成原因特殊,承载力弱,易塌陷,含水量大,如未进行处理会影响公路路基的稳定性和安全性,为后期施工埋下安全隐患。研究围绕公路施工中软土路基处理技术及应用,具体分析软土路基的特点和危害,提出几种常用的处理技术和方法,为公路施工软土路基的处理提供指导和参考。
期刊
环氧树脂(EP)因其优异的物理化学性能而被广泛应用于工业各个领域,如涂料、层合板、粘结剂、线路板、航空航天以及其他电子工业等。然而,与大多数有机高分子树脂一样,环氧树脂属于易燃物质,限制了其在高阻燃要求领域的应用。此前,卤系阻燃剂因阻燃效率高而被广泛使用,但由于当前环保要求更高,而卤系阻燃剂在燃烧时会释放卤化氢等有毒烟雾,对人类和自然环境都带来了很多风险和隐患,因此其使用越来越被限制。基于此,开发
学位
白局是南京地区的古老曲种。在推进文化自信、铸就社会主义文化新辉煌的进程中,深入开展信息化社会下非物质文化遗产传播研究具有突出意义。基于205份调查问卷,对南京白局非物质文化遗产传播特征进行分析,并运用数理统计方法分析其影响因素。研究结果表明,南京白局现阶段传播范围小,宣传强度弱,宣传方法不当,宣传途径数字化信息化程度较低;非物质文化与当地物质文化结合不够全面;政府对南京白局的重视程度不高;白局艺人
期刊
在新媒体时代,新的传播媒介和多元文化对潮剧的传承发展带来一定的冲击,但网络传播依然是潮剧传播的最佳选择。文章基于当前潮剧网络传播现状,提出促进潮剧与网络媒介深度融合、拓展潮剧兼容性以及培养受众对潮剧文化的认同感等对策,旨在促进新媒体时代潮剧的传承与发展。
期刊
报纸
学位
专业群教学团队的职业培训能力是专业群建设的重要指标之一,能否有效的评价专业群教学团队的职业培训能力是确保完成该项指标的重要保障。文章通过政策解读、文献研究和多维度的调查分析,得出适合高职院校专业群教学团队职业培训的评价模式,为专业群建设提供了参考。
期刊
旅行商问题是获得一位旅行商遍历所有地点的最短路径,是一个经典的NP-hard问题,在多项式时间的限制条件下,没有办法得到精确的解,并且需要大量的计算。随着计算机科技的发展,深度强化学习的出现,使得自主计算能力得到了极大的提升,解决复杂的旅行商问题变得相对简单。所以本文将深度学习与强化学习相结合,对旅行商系列问题展开讨论。我们考虑将旅行商遍历节点过程,使用强化学习中的马尔可夫决策过程建模。首先将旅行
学位
为全力保障我国基础交通事业发展,助力国民经济提升,提升公路施工质量与使用年限,结合软土路基的施工特性与施工重、难点,对现阶段较为先进有效的软土路基路段公路施工方式进行探讨,并提出相应的处理方案,以期为公路建设提供安全保障。
期刊