【摘 要】
:
近年来,以卷积神经网络(CNN)为代表的深度学习算法在目标识别和检测等多种任务中表现出显著的性能,成为许多研究问题的解决方案。然而,复杂任务的学习能力对人工智能的发展至关重要,一般来说,神经网络难以做到这一点,人们普遍认为灾难性遗忘是连接主义模型的一个不可避免的特征,目前基于深度神经网络的人工智能系统是为学习狭小范围任务而设计的,这样训练的智能体是不具有持续学习能力的,实现通用人工智能的关键步骤是
论文部分内容阅读
近年来,以卷积神经网络(CNN)为代表的深度学习算法在目标识别和检测等多种任务中表现出显著的性能,成为许多研究问题的解决方案。然而,复杂任务的学习能力对人工智能的发展至关重要,一般来说,神经网络难以做到这一点,人们普遍认为灾难性遗忘是连接主义模型的一个不可避免的特征,目前基于深度神经网络的人工智能系统是为学习狭小范围任务而设计的,这样训练的智能体是不具有持续学习能力的,实现通用人工智能的关键步骤是获得连续学习的能力,也就是说,一个智能体(agent)必须能在不遗忘旧任务的执行方法的同时习得如何执行新任务。为了训练可持续学习的智能体,亟待解决的问题是解决灾难性遗忘问题。无人车需要在各种复杂场景下行驶,并需要在不同场景中保证车辆的安全性。因此我们希望无人车能够在各种场景下执行任务时不断的获得新的技能,而不要忘记已经训练掌握的技能。本文以多无人车为测试环境,通过添加记忆机制来解决灾难性遗忘问题,防止车辆由于不同场景间知识遗忘所带了的安全隐患。在这里我们给出了一种多车场景学习框架,允许无人车对不同场景进行记忆。防止无人车在新场景学习过程中产生原有场景所学知识的遗忘,从而使无人车更好地学习新任务,同时更少地忘记以前任务中学到的知识。对于多车环境,我们发现不同无人驾驶车辆所学驾驶策略具有共性且存在学习过程的重复,因此,本文提出了基于经验共享的加速训练的方法,该方法通过在初始阶段学习过程中令多无人驾驶车辆进行经验共享,从耗时及收敛速度两方面提高无人驾驶汽车的学习效果。利用车辆策略的相似性转移基础知识网络,提高其他环境中无人驾驶车的学习起点。最后,本文对所提解决方案进行了多车环境下的仿真试验,实验表明(1)本文所提出的基于经验共享的加速训练方法,能够在收敛速度及耗时上明显优于车辆独立学习,并在学习效果上与之相当;(2)本文构建的场景学习模型能够在学习效果与传统的深度强化学习相当的同时,在多场景情况下令无人驾驶车辆在场景转换之间相对原有深度强化学习算法具有更好的安全性能,未在不同场景之间产生遗忘。
其他文献
苏霍姆林斯基说:"有怎样的校长,就有怎样的学校。"在新课程改革中,作为"一校之魂"的校长,牢固树立管理意识,提升管理智慧,是办好一所真正促人发展、让人民满意的学校的根本。校长
腹腔镜手术CO2气腹可能导致心肺功能障碍,非气腹提拉装置能够避免气腹造成的并发症及其对机体的不良影响。我院2012年1月-2014年1月选择67例老年胆囊结石合并胆囊炎患者,应用自
近些年来,由于对林业工作缺乏足够的重视,我国的林业病虫害状况已越来越严重。为了能够合理的治理这一现象,工作人员大量使用杀虫剂,来防治植物遭遇病虫害。随着我国科学技术的进
由于历史文化语境的嬗变,《聊斋志异》英译经历一个从跨文化操纵到文化和合的过程。在早期《聊斋志异》英译过程中,西方汉学家用西方意识形态和诗学观念指导自己的翻译实践,
新课程改革中校长应具备现代管理意识,即创新意识、科研意识、质量意识。
目的:探讨甲状腺疾病围手术期的医院优化护理方法与效果.方法:对125例甲状腺病人术前术后的护理措施进行效果观察.结果:经过手术治疗与合理的围手术护理后,本组15例甲状腺病人全
在《夏日》里,库切再次创造出新奇的写作形式——把自己放置到不同人物的视界之中,拼贴出一个影影绰绰的自己。某种程度上,这部作品像一部多声部的讲述,最终组合成库切关于自
<正>三、凯恩斯在北京难道储蓄过剩真的是由新兴市场的顺差引发的,然后通过美国金融部门蔓延到美国,并逐步加剧?借用杰奥夫·提利(Geoff Tily)的话说,从一个凯恩斯主义者的角
对公司股东会与董事会职权界限的确定,以及如何在不同公司机关中合理分配权力以实现良好的公司治理是公司法的核心问题之一。我国现行法虽就股东会与董事会职权作了较为具体的列举式规定,但由于立法技术的局限以及公司法未明确董事会的地位和性质,股东会与董事会职权的边界并不清晰,导致在公司治理实践中股东会与董事会就职权行使产生诸多争议。这些争议主要体现了立法在股东会与董事会职权分配上未予明晰的三个问题:其一,公司
目的 探讨微量元素锌、硒、铅及生殖激素与生殖健康的关系。方法 选取2016年5月—2017年5月在我院生殖中心内就诊的60例男性不育症患者为研究对象,选择60例健康男性当作对照