【摘 要】
:
铁路空车调配计划是进行运输组织的基础和重要条件,空车供求关系的时空变化特性和运输生产的动态性,使求解多时隙空车实时调配最优策略变得困难。强化学习中的Q-learning时序
【机 构】
:
西南交通大学,综合交通运输智能化国家地方联合工程实验室,上海市政工程设计研究总院(集团)有限公司
【基金项目】
:
国家铁路局科技开发项目(KF2019-101-B)
论文部分内容阅读
铁路空车调配计划是进行运输组织的基础和重要条件,空车供求关系的时空变化特性和运输生产的动态性,使求解多时隙空车实时调配最优策略变得困难。强化学习中的Q-learning时序差分算法能较好地解决不完全信息下的大规模序列决策问题,故本文将决策周期划分为若干个时隙,提出多时隙空车实时调配模型:首先利用空车实际调配的局部马尔科夫特性改进Q-learning算法,进行“单一空车调配策略评估”以量化单一空车在决策周期内所有时空状态下采取不同行动的长期回报;然后提出空车实时优先调配算法,求解决策周期全局最优的调配策略。
其他文献
文章以合肥万达广场城市综合体外部交通组织与公共空间为研究对象,通过调查分析,研究城市综合体外部交通组织对公共空间的影响。希望对城市综合体外部空间设计有所借鉴与启发。
《是什么带来力量--乡村儿童的教育》内容简介:该书是到中国志愿支教的德国教师卢安克,历经10余年教学实践的呕心之作,较完整地反映了他在一所山村小学——板烈小学的教育教学历
针对原始的局部相位量化(Local Phase Quantization,LPQ)算法对具有模糊不变性的相位特征描述不准确、缺少对图像重要细节信息描述的缺点,提出了一种结合高斯拉普拉斯(Laplace of Gaussian,LoG)边缘检测和增强局部相位量化(Enhanced Local Phase Quantization,ELPQ)的模糊图像识别算法,记为MrELPQ&MsLoG(Multi
目的考察阿魏酸哌嗪片原料药与各种辅料的相容性,以期提高产品的稳定性和质量。方法将阿魏酸哌嗪原料药与各种辅料混合后,通过加速稳定性试验,采用高效液相色谱法,考察阿魏酸
推进城乡融合发展是新时代构建新型城乡关系的重要制度安排。地方政府是推进城乡融合发展的重要责任主体。强化地方政府在推进城乡融合中的主体责任,更好履行政府职责,是实现
随着环境、资源和人口问题的逐渐突出,研究居民的行为以促进电子废弃物的回收变得非常重要。既有研究通常立足于居民的社会人口属性研究不同人群的回收行为差异,或更进一步分
本文以混动双离合变速箱实际出现的吸空油问题为例,采用SPH无网格粒子法,运用nanoFluidX软件模拟变速箱中齿轮的运动规律,进行气液两相流仿真分析,分析结果不仅复现了实际现
随着时代的发展和科学的进步,伞的颜色、款式设计越来越丰富,面料越来越讲究,配合不同的服装、不同的季节、不同的环境,有着各种各样的用途。伞的设计尚未有一个严格的规格,
以2-氯代三苯甲基氯树脂为载体,采用Fmoc/t-Bu/Dmab正交保护策略,在微波辅助下合成了环肽c(fKRGD),收率22.5%,纯度94.5%,其结构经MS(ESI),MS(MALDI-TOF)和HPLC确证。
为建立农业节水和农田水利工程良性运行机制,2016年1月,国务院办公厅印发了《关于推进农业水价综合改革的意见》,在全国范围全面推进农业水价综合改革。文章根据该意见要求,