【摘 要】
:
传统的自动驾驶行为决策算法需要人为设定复杂的规则,从而导致车辆决策时间长、决策效果不佳、对于新的环境不具有适应性,而强化学习作为近年来机器学习和智能控制领域的主要方法之一,车辆仅通过与环境交互便可以学习到合理、有效的策略。本文基于DDPG((Deep Deterministic Policy Gradient)算法,通过设计合理的奖励函数、深度卷积网络、探索策略,在Carla模拟器中实现指定路线的
【机 构】
:
北方自动控制技术研究所军种指控系统研发部 山西 030000
论文部分内容阅读
传统的自动驾驶行为决策算法需要人为设定复杂的规则,从而导致车辆决策时间长、决策效果不佳、对于新的环境不具有适应性,而强化学习作为近年来机器学习和智能控制领域的主要方法之一,车辆仅通过与环境交互便可以学习到合理、有效的策略。本文基于DDPG((Deep Deterministic Policy Gradient)算法,通过设计合理的奖励函数、深度卷积网络、探索策略,在Carla模拟器中实现指定路线的自动驾驶。
其他文献
对当前程控交换机具体应用加以分析,程控交换机基本处于不间断运行状态。在24小时不间断工作中,极易出现诸多故障问题,这也意味着,对交换机要求逐渐提升。为提高程控交换机应用能力,应重点分析可能出现的故障因素,并针对不同问题,制定科学集中管理之策,并创新管理与维护方式,借助远程维护方式,解决传统维护存在的不足之处,进而提高程控交换机稳定运行能力,使程控交换机作用得到充分发挥。
锰作业工人发锰的测定朱邦璇以锰矿洗选和锰粉加工的作业人员77名为锰接触组,其中男性51人,女性26人,平均年龄35.3岁,平均工龄10.O年。为了探讨职业性锰接触与发锰的变化关系,又将锰接触组分为1988年
关于KJD2000A空气净化器效果的调查报告四川省成都市卫生防疫站(610021)尹卉,李才明,谢先国,叶庆临,唐莉佳,廖骏空气净化器自国外70年代末诞生,90年代进入我国以来,以操作简便、大气量、高效率地循环室内
近年来,医疗服务领域新形态不断涌现,互联网医院作为其中突出的一种,在远程诊疗、线上问诊等方面展现出巨大的发展潜力。本文结合互联网医院目前的发展现状,梳理分析互联网医院的发展瓶颈及其优势特点,并提出对于互联网医院未来发展思路的相关思考。
在社会经济发展的新时代背景下,网络技术的不断革新影响着社会的各行各业的发展。其中,电力企业信息化也得到了迅猛的发展。本文针对电力企业网络信息系统在发展过程中存在的各种问题进行各种角度的研究和探索,结合新时期国家网络安全有关规定,对网络信息系统的安全防范展开探究,希望能够对电力企业的网络信息管理人员产生积极影响。
当前人类社会的发展已迈入信息时代,而数据传输技术也在时代需求的刺激下实现了跨越式的发展,光纤网络在现代化通信传输作业中占据了非常重要的地位,不仅方便了人们的生产、生活,同时也大幅推动了社会发展的进程。由于光纤通信传输网络在我国具有战略性的重要意义,因此其维护工作及相应技术也就受到多方重视。本文将围绕光纤通信传输网络的维护技术展开研究。
随着大型医院集团化发展,多活数据中心成为多院区协同医疗的基石。本文思考建立跨院区双冗余的传输架构,采用SDN控制器弱控组网方案,通过Vx LAN技术打通跨院区大二层网络,利用MP-BGPEVPN完成控制面的自动学习,实现虚拟服务动态漂移,确保医疗业务的连续性。SDN控制器负责服务策略下发,安全资源灵活分配等。此外,本文思考建立一套针对医院业务,可跨院区管理的监控平台,提升数据中心运维效率。