基于规则的强化学习及其在机器人导航中的应用研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:my163mail12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习是机器学习重要研究领域之一,是实现智能体自动适应环境的主要工具,并在复杂任务中显示出巨大潜力。但是当前强化学习技术需要大量的交互数据,在现实应用中需要高昂的数据成本。尤其在机器人导航应用中,可训练数据较少,数据利用率低,为了缓解该问题,本文提出一种基于规则的强化学习及其在六边形栅格地图环境下的机器人导航方法,该方法可提高算法收敛速度并提高路径的平滑性。在机器人导航中,本文选择使用六边形栅格地图代替传统的四边形栅格地图,以提高对复杂环境的适应性并提高了机器人动作规划的自由度以及规划路径的平滑性;在此基础上,以规则的形式引入人类导航常识,提出并实现了基于规则的强化学习方法。具体工作包括:(1)建立适用于机器人导航的六边形栅格地图,实现并测试了六边形栅格地图环境下基于强化学习的导航方法;(2)提出了基于规则的强化学习方法,首先通过沿墙走规则获得两条从起点到终点的轨迹,进而使用约简规则对所获得的轨迹进行空间约简,并通过理论分析证明最优路径仍在约简后的空间内,最后使用Pledge规则引导智能体进行高效学习;(3)构建了机器人导航系统,通过实验验证了不同环境下所提出方法的有效性和优越性。本文工作是对结合了规则推理的强化学习方法的有益尝试,并结合机器人导航控制进行了应用研究,对于强化学习方法和室内导航技术的研究均具有借鉴意义。
其他文献
电致化学发光(Electrochemiluminescence,简称ECL)是在化学发光基础上发展起来的一种新的分析方法,是化学发光与电化学结合的新的技术。它同时具有化学发光与电化学技术的优点,比如灵敏度高、选择性好、背景信号低、线性范围宽,反应可控等特点。目前,已有的电化学发光体系包括无机体系、有机体系和纳米材料体系。其中,无机体系主要包括钌配合物和铱配合物,有机体系主要包括蒽、芴、噻吩基三唑,
本文中,我们探讨了机器学习中的稀疏重构问题。针对非凸且NP-难的L0优化问题介绍了两种求解思想:L1正则化方法和贪婪策略。对于这两种求解思想我们列举出了相应已提出的算法。贪婪逆尺度空间流算法由自适应逆尺度空间流算法演变而来,同时结合了L1正则化方法的准确性和贪婪算法的高效性。本文介绍了精度矩阵的统计学意义,并将贪婪逆尺度空间流算法自然地推广到稀疏精度矩阵的重构中。最后,我们将贪婪逆尺度空间流算法重
随着大数据时代的到来,信息过载问题日益突出。如何从大量的非结构化的数据中找到对自己有用的信息成了急需解决的问题,在这种情况下,推荐系统应运而生。本文主要介绍了关于topN推荐的协同过滤算法和基于图模型的算法,针对本文用到的学生刷卡数据集,进行了符合实际的算法的改进。本文提出了两种新的描述商品在推荐列表中的位置的评价指标。针对协同过滤算法,我们提出了一种计算相似度时减少算法复杂度的算法。针对图模型算
作为全球的重大挑战之一,癌症和基因疾病正严重危害人类的生命和健康。前人研究表明,金属元素可以通过与脱氧核糖核酸(DNA)碱基鸟嘌呤结合,打开鸟嘌呤和胞嘧啶间氢键,或者选
近年来,手势交互受到越来越多的关注。同时,随着深度摄像头(如Kinect,Real Sense)的应用和人体姿态估计算法的发展,我们可以从图片或视频中获取人体的关键点坐标。虽然基于关
在计算机视觉的研究中,图像去模糊是一个广受关注但难度较大的问题。一幅模糊图像的形成,原因是多种多样的:相机抖动、物体运动、相机失焦等等,这也使得去糊工作因为需要考虑多方面因素而显得复杂。图像去模糊根据模糊过程中的模糊核是否已知,主要分为非盲去模糊和盲去模糊两种类型。而本文主要研究的盲去模糊则是去模糊工作中已知信息较少,难度也较高的一类工作。在盲去模糊的过程当中,模糊核与清晰图像的先验工作是相当重要
我国西南地区锌矿资源丰富,这些资源中有大量的低品位硫氧混合锌矿,其特点是:锌品位低,闪锌矿和氧化锌矿共生,结构复杂,碱性脉石成分和SiO_2含量高,因而不宜采用酸性浸出;虽然采用氨浸法可以避免碱性脉石和SiO_2的溶出,有利于减少试剂消耗,能够处理这类复杂锌矿,但采用氨浸法不能溶出硫氧混合锌矿中难溶的闪锌矿或铁闪锌矿,致使锌的浸出率降低。针对氨浸法存在的不足,并根据硫氧混合锌矿中CaCO_3含量较
近红外二区(NIR-Ⅱ,1000-1700 nm)荧光生物成像与常用的可见光(400-700nm)与近红外一区(NIR-I,700-1000 nm)相比,具有组织穿透能力更深和信噪比更高等优势,近年来得到了广泛的关注
近年来人工智能的迅速发展为计算机技术注入了新的生机与活力,深度学习凭借其优异的性能,已被广泛应用在多个领域,其中不乏安全敏感型领域,如自动驾驶。因此深度学习的安全性
大丽轮枝菌(Verticillium dahliae)引起的棉花黄萎病是一种土壤传播的维管束病害,是生产上最重要的病害之一。由于缺乏好的抗源材料与防治药剂,棉花黄萎病防治较为困难。微菌核