基于深度强化学习的机器人视觉控制技术研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：shuzhong12miyan

【摘要】

：

机器人控制作为智能制造和工业4.0的核心组成部分,随着深度学习在视觉任务上的蓬勃发展和强化学习在序列决策领域的应用,结合深度强化学习方法的机器人视觉控制方案具有研究

【作者】

：

黄叶

【出处】

：

上海交通大学

【发表日期】

：

2004年期

【关键词】

：

深度强化学习目标检测机器人学习注意力机制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器人控制作为智能制造和工业4.0的核心组成部分,随着深度学习在视觉任务上的蓬勃发展和强化学习在序列决策领域的应用,结合深度强化学习方法的机器人视觉控制方案具有研究价值。本文围绕深度强化学习领域,开展了基于注意力机制的目标检测算法、基于传统控制理论的策略网络、分步机器人控制方案和端对端机器人控制方案的研究工作,其中:1.针对当前主流深度学习检测框架缺少对候选框空间相关性的利用的问题,提出了基于强化学习和注意力机制的并行目标检测方案。强化学习对当前窗口进行序列变换时,能够获取到相邻时间步中图像的语义相关性,充分利用了高级图像特征中所包含的空间信息;基于注意力机制的状态初始化方案能够显著减少目标检测所需的步数。在公开数据集上的检测结果表明本文提出的方法能够达到准确的检测和分类效果,且产生的候选区域远远少于其他方法;2.针对目前强化学习算法中策略网络结构单一的问题,提出了基于比例-积分控制方法的新型策略网络结构,将强化学习、注意力机制和控制理论结合,能够显著提高算法性能和样本利用效率。该结构对几乎所有的深度强化学习方法都具有通用性。在公开强化学习仿真平台上的实验结果表明,该架构可以实现比目前常用的几种策略网络模型更好的性能;3.针对传统机器人控制方法依赖模型、缺乏鲁棒性等问题,提出了基于深度强化学习的分步控制方案和端对端控制方案,这两种方案均需要视觉输入。分步控制方案将目标检测网络和策略网络经单独训练后再联合训练,但泛化性较差且流程复杂;端对端控制方案只需输入图像即可预测最佳动作,在不同控制任务中均可使用。这两种方案在仿真环境下的实验证明,深度强化学习能使机器人从零开始学会掌握一定的操作技能。本文提出的目标检测方法、PI策略网络和端对端控制方案均具有通用性,除了适合机器人控制任务,也可以应用到其他强化学习任务和视觉任务中。

其他文献

送技术进集群将“节能减排”效益最大化

在环保压力日益加大的今天，节能减排已经成为企业增效降本的重要举措之一。11月22日，“纺织之光棉纺织行业节能减排关键技术重点成果推广活动”在河南省新野举办，本次活动由纺织

期刊

节能减排工作减排技术产业集群效益最大化棉纺织行业棉纺织企业行业协会企业增效

野外池塘商品鳖不同密度生态养殖效果研究

野外池塘生态养殖商品鳖是我国近年来普遍推广的新型高品质商品养殖技术,特别是目前效益较好的野外商品鳖池塘混养南美白对虾的生态养殖模式,更是目前重点推广的养殖新模式。

期刊

池塘生态养殖养殖效果养殖密度商品鳖生态养殖模式南美白对虾养殖技术池塘混养

上海市社区服务中心糖尿病的防治质量评价

背景全球超过4.22亿成年人患有糖尿病,中国的糖尿病患者约占全球糖尿病患者的四分之一。因此,加强初级卫生保健(Primary Health Care,PHC)系统在管理糖尿病和其他慢性病方面的能力,是国家的优先发展战略。从财政角度来看,中国政府对于初级卫生保健医疗机构的财政补贴由2009年的28亿美元增加到2015年的203亿美元。此外,自2009年医疗改革以来,包括上海在内的中国主要城市实施了

学位

质量糖尿病社区卫生中国上海卫生政策混合方法

纳米金刚石有机复合型固定相的制备与应用

液相色谱技术在生物,医药和环境等众多领域都发挥着重要的作用,为了满足这些领域的分析要求以及解决复杂样品的分析问题,各种分析分离技术相继被开发,色谱柱作为液相色谱分离

学位

纳米金刚石/聚合物填料复合型固定相季铵化纳米金刚石阴离子交换剂

基于深度强化学习的机器人视觉控制技术研究

其他学术论文