基于强化学习的自动化停车场调度方法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:wangjue419
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济社会快速发展,汽车占有率不断增加,传统的停车场表现出车辆停放效率和停车场面积利用率较低的缺点。目前一种新的自动化停车场应运而生,由泊车机器人完成车辆的停放工作。停车场调度优化策略需要根据停车场中库位的空间分布以及停放车辆的信息,安排合适的库位并且减少自动化停车场长时间运行产生的能耗,设计合理的停车场调度策略对于自动化停车场的长期运行收益具有重要意义。针对自动化停车场调度问题,从如下几个方面提出优化调度的数学模型以及调度策略:(1)设计自动化停车场的运行机制,由泊车机器人完成车辆的自动停放,分析自动化停车场的能耗优化空间。在建立优化模型的基础上,提出了启发式动态规划算法,通过停放车辆的质量、停放时间的信息建立优化策略,对停放车辆的质量和停放时间分别做归一化处理,同时结合两者的归一化信息为车辆安排合适的库位。由于单纯的启发式动态规划算法考虑的是停车场为空情况下的优化策略,不能根据停车场状态的变化做实时处理,借鉴贪心算法的思想,利用贪心算法的优化结果作为动态调整的依据,实时修正启发式动态规划算法的计算结果,进一步提升了调度策略,降低自动化停车场的运行能耗。(2)由于动态调整算法仅仅考虑了停车场中停放车辆数的变化,未考虑每辆停放车辆的状态。基于强化学习算法,将自动化停车场优化问题转化为强化学习算法框架下的最优策略求解问题。通过对自动化停车场运行过程中的状态、价值模型、动作的奖励值函数的定义,构建基于DQN的调度优化算法。利用神经网络结构拟合价值模型,通过与环境交互以及样本价值的计算,不断逼近价值模型的真实值。基于DQN的停车场调度策略可以获得比启发式动态规划算法更好的运行结果。(3)在DQN算法的基础,对传统DQN算法做出改进。在样本数据结构方面,保存状态信息以及该状态下所有的动作的价值,与传统的保存状态与状态之间的转移形式有所不同,这种样本存储和训练方式可以在算法训练的前期获得较为准确的价值估计,避免价值模型陷入局部最优解。基于DQN的改进算法在训练前期具有较快的提升能力,并且获得更好的停车场调度策略。实验结果表明,启发式动态规划算法和改进DQN算法能够有效地降低自动化停车场的运行能耗,对于自动化停车场的长期运行收益具有重要意义。
其他文献
篮球运动项目是现代竞技体育以及体育教育的最普遍和最重要的形式之一,特别是随着篮球职业联赛的兴起以及篮球文化的内外交流,加快了篮球这种球类运动方式的大众化趋势。从文
浙东运河是中国大运河的东南发端和重要组成部分,姚江河谷地区运河系统依托姚江自然水系,沟通了钱塘江流域和甬江流域,成为联接宁波与绍兴地区的重要纽带,有着悠久的开发历史以及鲜明的地域特色。姚江河谷地区运河景观的发展和演变充分展示了人与环境的互动关系,反映了运河开发对自然景观及人居环境建设的影响。本文以姚江河谷地区的运河系统和聚落景观为研究对象,试从风景园林学视角,对两者及其之间的关系进行深入分析与研究
目的:本研究目的旨在探讨CA-SSR、BIM基因多态性与中医药联合EGFR-TKI靶向治疗晚期非小细胞肺癌的临床疗效相关性,综合评价培土生金理论指导下中药协定方联合EGFR-TKI治疗晚期非小细胞肺癌疗效及其预后,为中药联合EGFR-TKI治疗晚期非小细胞肺癌增敏增效提供分子生物学理论依据。并观察CA-SSR基因多态性以及BIM基因多态性与突变人群的关联性。方法:采用前瞻性的非随机对照临床观察研究
目的探讨2种中药多糖对耐力训练大鼠外周血T淋巴细胞亚群和活化T细胞数量的作用,为改善耐力训练引起的细胞免疫功能低下寻找有效的干预措施。方法120只雄性Wistar大鼠随机分
【研究背景】DPF2,又被称为REQ(Requiem),UBID4,ubi-d4,BAF45D。目前的研究资料显示,DPF2基因定位于小鼠Chr 19和人11q13.1,属于新型Krüppel型锌指蛋白d4蛋白家族,还属于SWI/SNF(switch/sucrose nonfermentable complex)复合物(在哺乳动物中又名BAF复合物)亚基之一。DPF2在哺乳动物组织中普遍表达,目前
氢气和甲烷等能源气体是当今社会一种重要的、绿色的能源载体,在社会经济发展中具有重要作用,然而这类气体的存储却是限制它们应用的一个重要瓶颈问题.金属-有机框架材料(MOF
采用基于密度泛函理论的第一性原理平面波赝势方法,计算了锂离子电池石墨负极在嵌Li过程中形成石墨嵌层化合物LixC6(0≤x≤1)的形成能、嵌锂平台、晶体结构、电子结构和弹性性
房地产住宅项目精装修是目前的趋势,很多已经写入土地出让合同里。为了满足房地产住宅项目批量精装修的要求,对土建结构的尺寸定位提出了非常严格的要求,随着越来越多项目使
纳米稀土发光材料已广泛应用到照明、光信息传输、荧光标记等领域。纳米荧光材料尤其在提高光学显示器件空间分辨率方面有着独特优势,使得其在场发射器件,等离子体平板显示,
大气激光通信非常适合于在海军舰艇编队内构建通信网。为了能进行可靠的通信,就需要研究专门的捕获、瞄准和跟踪(Acquisition, Pointing and Tracking简称ATP)系统。其作用是