基于强化学习的高铁桥梁布跨设计研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:fj123521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高速铁路建设对现代交通方式的发展发挥着重大作用,为有效控制路基沉降、节省土地资源、保证行车顺利,高铁桥梁中大多以桥代路。对于高铁桥梁,桥梁布跨在方案设计过程中是一个关键问题。高铁桥梁一般采用预制标准跨,传统的人工设计方式很容易产生碎跨,而且对墩高、工程量的考虑并不充分,尤其是针对长距离路段,设计人员很难同时将上百跨桥梁合理布置。因此,迫切需要研究采用人工智能的布跨设计代替传统人工方式,以提高效率、节省时间、节约成本。本文研究基于强化学习的高铁桥梁布跨设计方法。主要研究内容为:研究了高铁桥梁布跨基本原则并建立了布跨数据库。针对高铁桥梁布跨问题,概括了桥梁布跨基本原则以及曲线桥梁布置位置计算,然后利用C#语言进行CAD二次开发提取地形地物等桥梁布跨所需信息建立相应数据库。提出了一种基于强化学习中Q-learning算法的高铁桥梁布跨设计方法。在进行算法设计时,将将高铁线路离散化实现连续无限状态数到离散有限状态数的转变,避免因状态数目过多导致在Q表值计算时计算内存爆炸,保障了Q表值的正常更新计算;动作设计是根据梁库中可以选用的标准简支梁和连续梁类型进行设计,动作数目等于桥梁种类数目。根据桥梁布跨要求的优先等级对布跨条件进行权重配置,设计奖赏函数;基通过大量数值计算,分析参数对算法效果的影响,确定最终参数配置。通过实际案例,将Q-learning算法布跨方案与传统设计方案进行对比,发现新算法所得方案不仅效率快,而且降低了桥墩工程量。但是由于Q-learning算法自身一些缺点,该算法有可能陷入局部最优,导致部分区域桥墩设计侵入道路红线无法满足跨越要求。提出了基于模拟退火改进Q-learning算法的高铁桥梁布跨设计方法。针对Qlearning算法的缺点,设计出一种基于模拟退火Q-learning(SA-Q)的高铁桥梁布跨算法,并根据强化学习的探索利用关系,提出了一种新的根据Q值变化自适应变化的退火策略,使得算法前期进行充分的探索,保证布跨结果的多样性;同时利用模拟退火策略的突跳性,避免陷入局部最优解。通过两个实验算例对比传统设计方法、Q-learning和SA-Q三种方法的布跨方案,表明基于SA-Q算法在学习效率、收敛速度相比于Q-learning提升35%;与传统设计相比节省大量时间,所需工程量有所降低,并且能保证布跨合理性。
其他文献
乳化炸药是民爆行业中最受欢迎的炸药,它广泛用于各类工业爆破作业中,随着乳化炸药生产量的逐年增加,对它的质量要求也越来越高,质量的好坏直接体现在乳化炸药的稳定性上。乳
随着计算机技术的快速发展,图像识别技术也在不断的发展与完善。图像自动识别技术早已应用在了生产生活中的各个领域,将人从一些重复、机械的工作环境中解放出来,大大提高了
在控制领域中,高阶非线性系统的控制是许多科研工作者们关注的一个热门领域,该方向的研究已经走向多元化和交叉学科方向发展。本文主要研究了两类带有不确定性的高阶非线性系
安全监测是大坝管理的核心,也是不可或缺的一部分。若不对运行中的水库大坝进行周期性的检查和观测,不能够得到其运行状态的变化,不仅会使水电站的经济效益下降,还会影响库区
在数据挖掘领域,聚类算法因其具有简单、灵活、高效等优势,被广泛用于各种数据挖掘任务中。但当聚类数据不足时,传统聚类算法很难取得较好的聚类结果。随着机器学习技术的发
随着软件系统的日益庞大与复杂,软件开发中存在着大量的重复行为,这些行为存在于软件开发过程中的分析、设计、编码、测试等各个阶段,因此为了把软件开发的成本降低,提高软件
近年来,人口老龄化趋势明显,慢性病患者数量急剧上升,医疗资源紧缺,医患关系紧张等社会问题越来越严峻,严重阻碍了社会的发展和降低了人们的生活质量。无线体域网(Wireless B
随着计算机和网络技术的不断发展,使得高速列车运行控制系统(简称高速列控系统)的功能更加复杂、交互更加频繁,同时也给系统的危险分析带来巨大挑战。而目前应用的基于头脑风
光纤传感器具有灵敏度高、结构简单、抗电磁干扰能力强和适应大范围监测等优点,在民航机场周界安防中有着重要应用前景。但在数据采集和信号识别过程中,存在系统工作环境复杂
近些年来,多智能体系统广泛应用于民用、商用以及军事等领域,多智能体系统的分布式协同控制问题广受关注。包含控制作为多智能体系统协同控制的一个基本问题,对其进行研究具