基于强化学习的自动泊车算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:qhxfxfxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着汽车工业的迅速发展,“新四化”的浪潮席卷整个汽车行业。“智能化”作为“新四化”的关键部分,自然成为了当前的研究热点。自动泊车技术是车辆智能化的研究方向之一,其主要作用是在驾驶员进行泊车的过程中对驾驶行为进行辅助或者代替驾驶员进行泊车,使驾驶员避免因为车位狭小或者泊车环境复杂而难以停车。在随着汽车保有量逐年增加而导致的泊车环境变得愈发复杂的大环境下,自动泊车算法也逐渐成为企业以及高校的研究重点之一。首先,本文对当前国内外的自动泊车产品化以及自动泊车控制策略的研究现状进行了阐述。基于当前自动泊车的控制策略,选择将强化学习与自动泊车的控制策略进行结合的自动泊车算法作为本文的主要研究目标。为了量化在训练以及测试中对于车辆位置以及姿态的描述,本文选用的泊车坐标系将简化的高斯坐标系与传统的车辆坐标系相结合。本文基于阿克曼转向原理对车辆模型进行了简化,建立车辆泊车运动学模型。使用建立的泊车运动学模型对最小转弯半径进行了计算,可以为后文停车场的布置限定条件。其次,本文从智能体、动作、环境、观测与奖励四方面对强化学习的基本理论进行了介绍,又从模型以及学习准则方面对于深度学习的基本理论进行了介绍。由于自动泊车的动作空间为连续值,所以本文选择了DDPG以及SAC作为本文的自动泊车算法。为了使对于智能体的描述更加准确,本文选择了车辆实时的横纵坐标、车辆实时的速度、车辆的航向角作为强化学习要素中的车辆状态。基于车辆在自动泊车中的动作,将车辆的前轮转向角以及车辆的加减速定义为强化学习要素中的车辆动作空间。从安全性、停入泊位的姿态、舒适性三个角度考虑定义了强化学习要素中的奖励函数。最后,本文对基于Open AI Gym搭建的highway_env进行改进,使之满足自动泊车的仿真需求。然后对环境以及车辆的特性进行了定义并对数据收集的方法进行简要介绍。为了方便对于训练以及测试过程进行评价,本文定义了训练的评价指标即总累计奖励和成功率,也定义了测试的评价指标即泊车轨迹、车辆的速度变化、车辆的加速度变化、车辆的前轮转角变化。本文的训练采用了循序渐进的训练方法,首先在简单场景进行训练,然后将训练好的智能体继承到后续的训练中。在完成智能体的训练后,将智能体置于搭建的自动泊车仿真驾驶模拟器中进行测试,再根据前面定义的评价指标对测试效果进行评价,测试结果表明DDPG以及SAC的智能体均可以完成泊车,验证了自动泊车控制策略的有效性。
其他文献
全面预算管理是一项具有很强技术性、科学、高效的管理体系,它对于企业权力分配、责任分发、运营机制优化具有积极的促进作用。在全面预算管理视域之下,建筑施工企业应充分利用、发挥全面视域管理的优势,加强对其的重视程度,不断优化企业内部的资金管控工作、工程施工工作、工程造价工作等各方面工作的实施,提高自身的市场竞争力以及经济、社会效益。因此,本文从全面预算管理视域出发,分析其对建筑施工企业资金管理工作的重要
从素养到美术学科核心素养,可以看出学生养成终身学习的习惯、适应社会发展应该具备的关键因素就是核心素养。为在高中美术教学中体现核心素养,该文作者把握美术学科的特点,寻找有效的教学策略,增强美术教学的有效性,促使学生在学习过程中建立正确的审美观,形成美术学科五大核心素养。
目的 探讨金水宝胶囊联合左甲状腺素钠片治疗桥本甲状腺炎的临床疗效。方法 200例桥本甲状腺炎患者,根据治疗方式不同分为常规组和研究组,每组100例。常规组应用左甲状腺素钠片进行治疗,研究组应用金水宝胶囊联合左甲状腺素钠片进行治疗。比较两组患者临床疗效、甲状腺激素[游离三碘甲状腺原氨酸(FT3)、游离甲状腺素(FT4)、促甲状腺激素(TSH)]水平、甲状腺抗体指标[甲状腺过氧化物酶抗体(TPOAb)
心力衰竭(HF)是一种慢性全身性疾病,由于其高患病率、高死亡率和高医疗成本等特征,目前已成为一个日益严重的公共卫生问题。有证据表明,慢性HF形成的过程中经常伴随着营养不良的症状。同时,营养不良也与伤口愈合障碍、术后并发症的发生率和死亡率存在关联。营养不良已成为医疗保健系统和日常临床实践中的一个挑战,它会影响疾病的进程和患者的预后。营养干预对HF患者的病理生理学、治疗和结果的影响越来越受到重视。口服
随着轮式机器人在日常生活中的普及,人们越来越关注它工作时的安全性。轮式机器人在环境中如何高效地自主避障,一直作为移动机器人领域的热点和难点,避障结果的优劣也会间接影响导航与定位的结果。要想实现精准地避障,就必须对周围环境的拥有较好地感知能力。利用多传感器信息融合技术,能较好地发挥每个传感器的优势,能够获得较为全面的外部环境数据,从而提高避障时反应的准确性和快速性。因此,本文针对轮式机器人在复杂环境
近年来,在“互联网+”的驱动之下,我国互联网银行逐步兴起、迅速发展,从我国第一家互联网银行微众银行成立起,仅有短短5年时间。作为一种新型的商业银行,互联网银行依托网络大数据的优势,将贷款提供给传统商业银行没有覆盖到的长尾客户,促进普惠金融发展。与传统商业银行管理类似,互联网银行的不良贷款率管理事关该银行的生存与发展,也对全国金融市场稳定发展发挥重要作用。我国互联网银行不良贷款率虽然当前仍低于国内传
物流行业作为国家经济实力的重要组成因素,在引导国家经济发展,提高国民生产总值等决策上发挥着重要的作用。在全球经济一体化趋势的大背景下,物流业已经成为我国重要的经济支柱之一。现代物流的蓬勃发展得益于信息技术的支持,如何通过现有的技术手段来构建一个与互联网产业相匹配的物流配送体系显得格外重要。通过控制运输成本,可以显著地提升现代物流的效益,实现科学化的配送体系管理。组合优化是计算机科学与运筹学中的一个
在初中生价值观建构的关键时期渗透仁爱、守信、正义、和合、大同等核心思想理念有助于更好地培养学生科学的价值观,使学生在学习实践中换位思考,构建和谐的人际关系和良好的社会关系,并传承和弘扬优秀的道德品质。以初中语文教学实践为例,分析新课标理念下传统文化在语文教学中的融入策略。
社会迅猛发展,科学技术实时更新,信息技术也在不断改变着各个行业,例如教育行业等。在此之前建筑行业信息化进程相比其他行业起步晚且发展缓慢,但是在信息创新变革逐渐深化的趋势下,建筑行业随着信息化发展进程进一步打造了BIM技术,推进了建筑行业的信息化变革。BIM技术也就是所谓的建筑信息模型,可集成建筑工程的设计环节、施工环节、管理环节于一体的多层面结构化数据库系统,对整个建筑领域有着不可替代的关键性促进
随着一批新的调水工程的开工建设,工程占地、移民征迁不再局限于农村范围,涉及到城区土地、城镇人口的征迁安置,对原有的实物认证和补偿方式从政策层面提出了挑战。引江济淮工程在征迁实施阶段,移民规划设计实物调查与地方政府聘用“第三方”成果调查形成了两种不同版本,产生不同数据成果。在城区地方政府将水利工程移民项目与城镇建设项目相融合“整村推进”拆迁的情况下,对征迁实物量的认证及相互衔接,探讨了新的模式。