【摘 要】
:
随着人工智能技术的不断发展,在静态、确定的场景中,路径规划的问题已经成为一项非常成熟的技术。然而在环境信息不确定和观测信息不确定的场景中,由于环境空间复杂、突发情况频发且智能体视线范围有限,给路径规划算法的鲁棒性、泛化性和自适应能力带来了重大挑战。高度不确定场景中强时空约束的智能体路径规划问题是自动规划技术领域的研究热点,如何设计避障能力强且具有高泛化能力的实时路径规划算法是亟待解决的重要研究问题
论文部分内容阅读
随着人工智能技术的不断发展,在静态、确定的场景中,路径规划的问题已经成为一项非常成熟的技术。然而在环境信息不确定和观测信息不确定的场景中,由于环境空间复杂、突发情况频发且智能体视线范围有限,给路径规划算法的鲁棒性、泛化性和自适应能力带来了重大挑战。高度不确定场景中强时空约束的智能体路径规划问题是自动规划技术领域的研究热点,如何设计避障能力强且具有高泛化能力的实时路径规划算法是亟待解决的重要研究问题。本文利用强化学习,分别研究了智能体离散动作、连续动作、连续平滑动作以及多智能体路径规划问题。本文的主要工作如下:1)研究了基于DQN(Deep Q-Learning)的动态避障与离散路径规划算法。该算法首先利用轨迹预测算法,预测动态障碍物的位置,解决了环境信息的动态不确定性。然后利用强化学习决策要执行的动作,解决了无数据训练和传统路径规划算法中泛化能力差的问题。最后通过动态调整奖励值,提高了智能体避障的准确性和算法的收敛速度。2)基于研究内容一提出的离散路径规划算法,研究了基于DDPG(Deep Deterministic Policy Gradient)的连续路径规划算法。该算法首先利用最小二乘法预测动态障碍物的未来的轨迹,然后利用DDPG根据动态障碍物的短期未来的轨迹在连续空间里学习和决策,减少了路径长度和平均转弯角度。最后基于人工势场设置奖励函数,提高了混合避障算法的收敛速度和准确率。3)基于研究内容二提出的连续路径规划算法,研究了基于DDPG的平滑路径规划算法。首先基于动力学原理,利用MPC(Model Predictive Control)算法预测动态障碍物的轨迹。然后,根据动态障碍物的预测轨迹利用DDPG为智能体提供在连续空间里学习和决策行为的能力。仿真实验结果表明,该方法能准确地实现动态环境中的混合避障与平滑路径规划。4)基于以上三方面研究内容提出的单智能体的路径规划算法,研究了基于MADDPG(Multi-Agent Deep Deterministic Policy Gradient)的多智能体时空路径规划算法。该算法首先在BIT*(Batch Informed Tree*)中利用多线程方式计算多智能体的路径,然后在三维时空上通过设计碰撞检测模块,实时检测障碍物和智能体之间的碰撞关系,最后利用MADDPG算法对路径进行实时重规划。实验结果表明该算法提高了多智能体路线规划的效率和实时性。
其他文献
桥梁的节段短线预制和悬臂拼装施工是通过“化整为零”,将主梁分割成若干节段在工厂或施工现场预制后运至现场进行组拼,具有施工标准化、工业化和装配化等特点,为城市高架桥梁施工提供了新的方式,且符合国家提倡的装配式建筑和绿色可持续发展战略,具有良好的发展前景。短线预制悬臂拼装桥梁对线形控制精度要求非常高,然而现有的施工线形控制方法精度不足,缺乏偏差分析调整和预测的有效方法。鉴于此,本文依托郑州市四环节段拼
大提琴换把技巧的掌握是评价演奏者演奏水平高低的重要因素之一,精准的把位运用可以更好地表现音乐的情感与文化内涵,从而使欣赏者产生情感共鸣体验。笔者以德米特里·德米特里耶维奇·肖斯塔科维奇创作的《降E大调大提琴协奏曲》为例,通过对大提琴换把的手指运动原理、技术训练方法等予以解析,并就不同种类的换把方式对作品音准、音色的表现,设计不同的换把和指法,为大提琴换把技术研究添砖加瓦。
<正>随着央企逐渐进入国际市场,参与到越来越多的海外工程的竞标和建设中。如何做好项目的标前设计,避免因标前设计缺失而产生工程风险,是竞标环节的重难点。中交机电局武汉设计院作为中交系统内唯一的轨道交通机电设计团队,多次协助中国港湾、中国路桥参与海外铁路、城市轨道交通项目的竞标,以及在建项目设计管理和设计工作。
依托位于上海临港新区的科学家社区项目,从施工单位作为EPC联合体牵头单位的视角,在合同谈判与签订之前对商务合同设计风险进行分析。首先,制作风险识别清单,罗列13个大项,71条小项的风险点;其次,组织专家进行打分,采用风险评价指数法进行风险评估;然后,陈述风险应对的4条基本措施:风险回避、风险转移、风险共担、风险自理;最后,建议在项目实施过程中,进行风险监控以随时改变风控措施。在此基础上,运用头脑风
随着时间的推移,我国服役时间较长的混凝土结构数量将会不断增多,结构的安全使用问题提到重要的议事日程。在对已建多年的混凝土结构进行安全复核与评估时,混凝土的既有强度是一个重要的指标。表层混凝土长期暴露在大气中,碳化会影响到混凝土强度,如何评定这些长龄期混凝土结构的强度是一个值得研究的问题。本文对12片混凝土墙体进行了 14年龄期“回弹值—碳化深度—实体混凝土强度”的试验研究,其中实体混凝土强度取为测
为降低公路项目设计风险,以某国道淮河大桥段改扩建工程项目设计为背景,采用基于层次分析法(AHP)的灰色聚类评价的方法建立风险模型,进行设计风险评价,定量获得总体风险指标和设计前、中、后三个维度设计指标,确定设计风险等级水平,便于为后续施工提出风险应对策略,供同行参考。
近年来,我国建筑行业的发展速度不断加快,给建筑企业、施工单位、设计单位、监理机构等产生了较大的机遇。随着人们的经济水平不断提升,越来越多人对于建筑结构的性能和内部装饰装修有了更高的要求,希望能够满足自身的风格需要。这就要求建筑设计单位从多个角度考虑工程设计,完成建筑工程先头任务,从而决定工程总体建设方向。但是在具体开展建筑设计项目时,还是会受到较多因素的影响,产生设计风险。基于此,需要采取可靠性措
<正>深化国有企业改革的实践充分说明,国有企业坚持党的领导和建立现代企业制度不可或缺。作为国有企业,要坚决坚持党的领导和党的建设第一要务,巩固“根”“魂”建设,用党的二十大精神引领公司高质量发展,建立“党委的领导,董事会的战略决策,纪委、监事会的独立监督,经营管理层的批准运作”的科学有效治理格局,
碳纤维增强聚合物(Carbon Fiber Reinforced Polymer,CFRP)外贴加固钢结构由于材料性能优越、施工便捷等优势,被认为是一种具有发展潜力的钢结构加固技术。相关研究发现,腐蚀环境下CFRP-钢界面的长期耐久性能会出现大幅度下降,主要原因是界面结构胶在腐蚀环境下发生劣化,导致加固界面出现过早的严重剥离。因此,如何提升CFRP-钢界面在腐蚀环境下的耐久性能就成为保证CFRP加
随着现代社会工作和生活方式的转换,脊柱疾病有逐年增多和逐渐年轻化的趋势,颈椎病作为现代最常见的脊柱疾病之一,如何有效地诊断与治疗颈椎病己经成为临床研究的热点。医学影像是临床中传递信息和分析病情的重要形式,CT(Computed tomography)检测是颈椎病中常见的成像检查方式之一。由于人体的组织结构错综复杂,在CT图像采集的过程中,受到光线、温度,设备噪声等各种因素的干扰,导致CT图像存在对