【摘 要】
:
针对现有基于深度强化学习(deep reinforcement learning, DRL)的分层导航方法在包含长廊、死角等结构的复杂环境下导航效果不佳的问题,提出一种基于option-based分层深度强化学习(hierarchical deep reinforcement learning, HDRL)的移动机器人导航方法.该方法的模型框架分为高层和低层两部分,其中低层的避障和目标驱动控制模型
【基金项目】
:
中国科学技术大学优秀引进人才基金项目(KY2100000021); 国家自然科学基金项目(61971393,61871361);
论文部分内容阅读
针对现有基于深度强化学习(deep reinforcement learning, DRL)的分层导航方法在包含长廊、死角等结构的复杂环境下导航效果不佳的问题,提出一种基于option-based分层深度强化学习(hierarchical deep reinforcement learning, HDRL)的移动机器人导航方法.该方法的模型框架分为高层和低层两部分,其中低层的避障和目标驱动控制模型分别实现避障和目标接近两种行为策略,高层的行为选择模型可自动学习稳定、可靠的行为选择策略,从而有效避免对人为设计调控规则的依赖.此外,所提出方法通过对避障控制模型进行优化训练,使学习到的避障策略更加适用于复杂环境下的导航任务.在与现有DRL方法的对比实验中,所提出方法在全部仿真测试环境中均取得最高的导航成功率,同时在其他指标上也具有整体优势,表明所提出方法可有效解决复杂环境下导航效果不佳的问题,且具有较强的泛化能力.此外,真实环境下的测试进一步验证了所提出方法的潜在应用价值.
其他文献
传统导航方法只能检测出路径上存在的静止障碍物,无法检测出运动障碍物,为此提出基于深度学习的盲人避撞路径导航方法.收集语音信号,利用语音识别模型获取语音特征参数,根据语音特征参数识别出盲人输入的语音序列内容,确定盲人所要到达的目的地.构建障碍物检测模型,检测盲人所在位置与其目的地路径上障碍物的形状特征及其运动方向、速度,并计算初始位置与到达位置的距离.利用深度学习中的卷积神经网络规划出最优避撞路径,
目的 了解湖南省脑出血(intracerebral hemorrhage, ICH)患者住院费用及构成,并对其影响因素进行分析,为控制和降低ICH住院费用提供依据。方法 利用湖南省二级以上公立医院ICH患者的住院费用相关信息,进行住院费用构成的描述并探讨影响住院费用的因素。结果 共13518例ICH患者纳入研究,住院费用中占比最高的为药费(27.1%)。三级医院住院费用的治疗费用占比高于二级医院,
针对传统导航方法对地图精度依赖和动态复杂场景适应差问题,提出一种基于课程学习的深度强化学习无地图自主导航算法。为了克服智能体稀疏奖励情况下学习困难的问题,借鉴课程学习思想,提出一种基于能力圈课程引导的深度强化学习训练方法,其思想是依据智能体能力评估结果设置合适的课程任务目标,在课程任务的引导下智能体导航能力逐步提升,有效缓解导航训练情景下奖励稀疏的问题。此外,为了更好地利用机器人当前的碰撞信息辅助
开发施工进度计划设计工具,通过自定义项目类型等基础数据与项目任务相关联,统计项目工程量、资源消耗、道路运输强度等信息。基于CAD二次开发,定制标准化的CAD横道图和施工强度曲线绘制工具。应用于国内某大型水电工程可研阶段施工进度设计道路运输强度分析及横道图绘制,提高设计的效率和质量。
目的:评价猪小肠黏膜下层(SIS)可吸收生物膜用于牙槽骨和/或软组织修复重建的有效性和安全性。方法:采用随机、单盲、平行对照、多中心、非劣效临床试验设计。主要评价指标为术后0 d及180 d术区牙槽嵴最大长度、最大高度和最大宽度的改变。次要观察指标为术区牙槽骨增生和吸收变化,牙槽骨基质边缘线变化,试验用膜是否破损,手术切口愈合,排异反应及填充后症状。通过不良事件发生频率和严重程度评价SIS可吸收生
目的 分析尿失禁与抑郁症和焦虑症的发病风险之间的关联。方法 本研究基于英国大型队列研究(UK Biobank),排除了基线患有及随访1年以内确诊抑郁症或焦虑症的样本,最终495 398人被纳入分析。采用Cox比例风险回归模型估计基线是否患有尿失禁与抑郁症和焦虑症的风险比(hazard ratio,HR)及其95%置信区间(confidence interval,CI)。结果 在中位随访时间11.5
辣椒病害是辣椒生产的大敌,从抗性鉴定、抗性遗传规律、抗性基因定位、抗性品种选育对辣椒病毒病、疫病、炭疽病和白粉病4个主要病害进行了综述研究,以期为今后辣椒抗病育种提供参考。
<正>我国的奶牛畜牧业,目前已经处在产业稳定期。奶牛饲养现已形成了规模化生产,大中型养殖场成为主要经营主体。在生产技术上也不断向现代化方向发展,但在饲养管理技术与先进生产设备的应用方面,与发达国家相比有所差距。据2020年全国统计资料显示,我国奶产品品质进一步提高,牛奶的平均乳脂率超过了3.98%,与2011年比较,均增加了0.19%,而与南美洲、大洋洲国家比较,均增加了0.11%,中国的奶产品已
目的探讨开刻立预防阻生智齿拔除术后不良反应的临床效果。方法240例需拔除阻生智齿患者,随机分为3组,每组80人,2个试验组和1个对照组,试验组1术前术后含服开刻立(西吡氯铵含片),试验组2口服阿莫西林克拉维酸钾片,对照组术前未服用任何药物,仅当术后出现不良反应后再给予口服阿莫西林克拉维酸钾片治疗3天。结果2个试验组阻生智齿拔除术后发生不良反应的病例数均较对照组少,而两个试验组间无明显差异。结论阻生