基于强化学习的自动化集装箱码头堆场优化方法研究

被引量 : 0次 | 上传用户:ZuoLuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着自动化设备、人工智能算法等技术的不断发展,自动化集装箱码头已成为未来集装箱码头的发展趋势,在集装箱码头智能化进程中占重要地位。其中考虑到自动化集装箱堆场不仅具有传统集装箱堆场的任务量庞大、作业资源种类和数量繁多、三维放置导致的操作困难、任务动态性强等特点,还具备自动化设备导致的时间要求高以及垂直岸边导致的两端交互、场桥接力等特点,堆场已成为自动化集装箱码头作业效率提升的瓶颈,急需探索更合理的作业计划和调度策略。然而传统方法如精确求解、启发式规则、智能算法等均存在运算时间长或求解精度不足的问题,难以在实际场景中使用。因此本文以自动化集装箱堆场为研究对象,基于较为新颖的强化学习方法深入研究对应的作业计划和调度策略,对集装箱码头的智能化进程具备重要意义。本文的研究来源于洋山四期自动化集装箱码头堆场,主要研究内容包括:(1)建立了自动化集装箱堆场优化问题的模型。本文详细分析了堆场优化问题具备的大规模、大量的复杂特性与约束、复杂的时空耦合特性以及强动态四大特性,将问题分解为箱位分配和场桥调度两个递进的子问题,确立了问题假设、优化目标和各项约束并构建了自动化集装箱堆场优化问题的数学模型。(2)提出了针对箱位分配的基于强化学习的超启发式算法。算法包括低层启发式算子和高层目标决策两个层面的内容,通过对求解方案的不断改进获取较好的解。在低层启发式算子中引入具备不同特点的局部搜索算子、全局搜索算子以及智能算法算子。在高层目标决策中提出了基于策略的强化学习算法智能选取合适的低层启发式算子,最终实现算法性能的提升。(3)研究了基于深度强化学习的场桥调度问题优化算法。算法基于序列到序列的框架采用合理的智能体定义和智能体与环境的交互方式求得较优的方案。在智能体定义中,基于任务不同种类的操作、考虑场桥冲突和车辆到达时间的可行性判断以及评价指标定义了智能体的状态、动作和回报。在交互方式中,基于模拟和启发式规则开发了环境与状态的更新方法,并设计了基于注意力机制的策略梯度计算方式和训练方法,从而实现在较短计算时间的基础上的算法性能提升。同时,通过实际的历史数据及根据其数据规律设计的算例对本文提出的模型和算法进行了验证。与常规方法、文献中提出的改进算法以及实际采用的启发式算法相比,本文提出的基于强化学习的算法能够有效提高作业效率并减少车辆的等待时间。最后,以洋山四期自动化集装箱堆场为背景,本文开发了一套自动化集装箱堆场仿真验证系统。基于调研得到的实际需求,完成了系统的总体设计、功能模块设计以及流程设计,为满足自动化集装箱堆场提高整体工作效率的需求提供了有效的工具和平台。
其他文献
介电弹性体驱动器由于具备能量密度大、结构简单、响应速度快等优势,已成为软体机器人领域的重要研究分支。其中多自由度的介电弹性体驱动器能以简单的结构实现复杂的运动,被广泛应用于各类软体机器人。然而,材料固有的粘弹性蠕变、迟滞非线性以及交叉耦合效应导致多自由度介电弹性体驱动器产生了严重的输出非线性,难以对其进行精确地轨迹跟踪控制。针对多自由度介电弹性体驱动器难以精确控制的挑战,本文以圆形介电弹性体驱动器
学位
文章基于对上海老旧住房结构安全总体情况的梳理,从政策供给、群众工作、资金平衡、创新技术等方面,总结分析近年小梁薄板房屋试点拆除重建、非成套老旧住宅结构加固和抗震性能提升的探索与实践,提出进一步深化上海老旧住房结构安全改造的思考,为有序推进上海老旧住房更新改造,加强老旧住房安全管理提供了思路。
期刊
为了实现汽车车身轻量化,先进高强钢在车身制造中得到了广泛的应用。第三代先进高强钢淬火-配分(QP)钢因在变形过程中发生相变诱发塑性效应而能同时获得良好的强度和塑性。QP钢的微观相变行为和宏观力学行为相互耦合,材料本构关系受多种因素影响,使得传统塑性理论难以准确高效地预测其复杂力学行为。机器学习凭借其强大的数据处理能力成为了更有潜力的材料力学行为计算范式。但机器学习模型需要大量的数据进行训练,基于机
学位
共线加工生产线在进行产品自动化换产时,需要通过AGV实现夹具在立体仓库与机床转台之间的转运。由于需要较高的定位精度以实现夹具子盘与母盘的零点定位,故对AGV提出较高的定位精度要求(±3mm)。然而目前要实现该精度通常是在AGV上搭载小位移机构,如机械臂、伺服轴等,但这种方式不仅增加了AGV的自重,还增加了其成本。麦克纳姆轮式AGV由于定位精度高、转向灵活等特点被广泛应用于制造业中。因此,如何在不搭
学位
学位
柴油发动机产业的发展与我国汽车工业、农业机械、工程机械、发电设备等产业密切相关。近些年来,随着人工智能与大数据技术的发展,柴油发动机制造工厂正在逐步向智能化、信息化、数字化、高端化转型,数据驱动的柴油发动机智能制造在“中国制造2025”进程中占重要地位。作为典型的复杂机械产品,柴油发动机的装配过程涵盖多个阶段以及大量的制造过程参数,直接决定了最终的产品性能与质量。为了提高柴油发动机装配质量,需要在
学位
发展高性能数控系统是我国中长期科学和技术发展规划的重大专项之一,对于国防军工领域关键零部件的加工有至关重大的意义。在相关政策的扶持下,科研人员在数控系统领域取得了一系列突破性的研究成果,逐渐缩小了与发达国家的差距。然而数控系统中普遍存在的非线性摩擦力会造成低速爬行,跟踪死区等现象,严重制约了系统响应品质和跟踪精度的进一步提升。为解决这一难题,论文基于开放式数控实验平台,进行摩擦建模与补偿研究,以降
学位
随着云计算不断发展,网络虚拟化技术也随之发展迅猛,数据中心网络中的应用业务越来越多,所产生的数据流也迅速增长。为满足庞大的数据流需求,数据中心网络采用了一种具有多转发路径的冗余拓扑Fat-Tree胖树型网络结构。为了在这种拓扑结构中实现网络资源的合理利用,过去经常使用的算法都是基于传统的最短路径算法或等价多路径算法ECMP实现对数据流的调度。然而,这些算法存在的问题是突增的数据流会立刻占用网络设备
学位
协作机器人是可以在工作区域直接与人进行交互的机器人,是实现智能机器人的优良平台,现已广泛应用在各类分拣作业中。但是现有的协作机器人分拣系统依然不够智能,无法适应大多数的工厂流水线分拣作业。其主要有以下三大难点需要解决:现有的工厂流水线分拣作业主要是动态分拣,需要很高的实时性和目标零件追踪能力,而流水线上的零件大多数都为无纹理或者少纹理零件,具有无法手工设计纹理特征和多个零件互相遮挡、相似的特点,容
学位
随着知识经济时代的到来,知识已成为企业重要的无形资产和宝贵财富,工程领域企业也越来越重视通过知识重用来创造价值。然而,面对知识数量的爆发式增长,效率低下的传统知识重用方法已无法满足工程用户的知识需求,严重影响了企业知识资源的价值转化。对此,利用先进的个性化推荐算法进行工程知识推荐,能够有效提升知识重用效率,协助工程用户高效解决工程设计问题并完成工程设计任务,进而提升企业生产效益、实现创新发展。然而
学位