基于强化学习的城市交通路径规划

来源 :计算机应用 | 被引量 : 2次 | 上传用户:leocaan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
城市交通路径规划需要考虑规划的快速性和车辆的安全性,而目前大多数强化学习算法不能兼顾两者。针对这个问题,首先提出采用基于模型的算法和与模型无关的算法相结合的Dyna框架,以提高规划的速度;然后使用经典的Sarsa算法作为选路策略,以提高算法的安全性;最后将两者结合提出了改进的基于Sarsa的Dyna-Sa算法。实验结果表明,提前规划步数越多的强化学习算法收敛速度越快。使用收敛速度和碰撞次数等指标,将Dyna-Sa算法与Q-学习算法、Sarsa算法和Dyna-Q算法进行对比,可知Dyna-Sa算法能够
其他文献
针对为解决视频监控中遮挡、背景物干扰,以及行人外观、姿势相似性等因素导致的视频行人重识别准确率较低的问题,提出了联合均等采样随机擦除和全局时间特征池化的视频行人重识别方法。首先针对目标行人被干扰或部分遮挡的情况,采用了均等采样随机擦除(ESE)的数据增强方法来有效地缓解遮挡,提高模型的泛化能力,更准确地匹配行人;其次为了进一步提高视频行人重识别的精度,学习更有判别力的特征表示,使用三维卷积神经网络
制度伦理就其内涵而言是制度伦理化和伦理制度化的辩证统一。制度伦理在我国兴起有其社会历史背景,制度伦理建设是道德建设的关键和突破口,加强道德建设需要制度伦理和德性伦理
目的探讨局部亚低温延长急性脑梗死治疗时间窗的临床效果。方法选取我院2013年4月至2014年1月收治的77例急性脑梗死患者作为研究对象,按治疗开始时间分为A组(≤6h)、B组(6~12h)、C
盘县地区位于贵州西部,具有丰富的煤系烃源岩资源,高厚度的煤层和各储存层相互依托,复杂的地质构造造就了煤系气成藏条件,通过对盘县地区龙潭组、长兴组煤系地层系统地质分析
Hybrid rice significantly contributes to the food supply worldwide. Backbone parents play important roles in elite hybrid rice breeding systems. In this study,
远古的血族,如今再度觉醒。人性与魔心,宿命与血缘,道义与爱情,当这些同时摆在前面,该如何抉择。千年的封印,连接两界的神魔之井成为震动六界的焦点,众人的命运逐渐交织在一起。
目的 探讨易瑞沙联合放化疗治疗肺癌脑转移的疗效.方法 将54例肺癌脑转移患者分为观察组30例与对照组24例,对照组采用放疗联合化疗治疗,观察组在对照组治疗基础上口服易瑞沙治疗,剂量为每天250 mg,服用时间为从入组至开始至病情出现进展,比较两组患者的疗效及随访生存期.结果 对照组治疗后完全缓解4例(16.7%),部分缓解10例(41.7%),无变化6例(25.0%),肿瘤进展4例(16.7%);
本刊讯三峡地下电站已经进入机组安装高峰期。如何对机组安装质量进行检测?如何评定机组安装质量等级?这些问题现在有了答案。中国三峡集团近期发布《三峡地下电站水轮发电机
期刊
亲爱的西西(阿姨?)、侠客、八爪、迪迪、小朵、暴暴、啷嘟、小嗣和小催,以及老编。还有丢丢,你们好吗?(替我向酋长带去同样崇高的问候!)作为一个老淀粉,我现在还存有的最旧的一本“少
本文是对认识的微观领域研究的一种尝试,笔者采用动态的、整体的、联系的方法对认识发展的动力机制进行了全面的剖析.首先,指出促进认识发展的根源是由外在动力系统和内在动