基于深度强化学习的机器人手臂控制

来源 :福建电脑 | 被引量 : 0次 | 上传用户：liongliong431

【摘要】

：

基于深度强化学习策略,研究了机器人手臂控制问题。以两节机器人手臂为对象,给出奖励函数和移动方式等。结合深度学习与确定性策略梯度强化学习,设计深度确定性策略梯度(DDPG

【作者】

：

杨淑珍韩建宇梁盼古彭杨发展吕萍丽

【机构】

：

中国矿业大学徐海学院,中国矿业大学徐海学院信电系

【出处】

：

福建电脑

【发表日期】

：

2019年1期

【关键词】

：

深度强化学习深度确定性策略梯度学习算法机器人手臂控制

【基金项目】

：

江苏省大学生实践创新训练项目201813579004Y.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基于深度强化学习策略,研究了机器人手臂控制问题。以两节机器人手臂为对象,给出奖励函数和移动方式等。结合深度学习与确定性策略梯度强化学习,设计深度确定性策略梯度(DDPG)学习步骤,使得机器人手臂经过训练学习后具有较高的环境适应性。实验表明基于深度强化学习机器人手臂可以快速并且准确的找到在环境中移动的目标点。

其他文献

采用FPGA＆DSP实现电子式互感器合并单元

一次电子式互感器与变电站实现数字化连接主要通过合并单元来实现。为此，介绍了电子式互感器数字输出接口的重要组成部分一合并单元的定义及其组成，分析了合并单元的功能特点进

期刊

电子式互感器合并单元接口现场可编程门阵列(FPGA)数字信号处理器(DSP)方案electronic instrument transformer

基于物联网云平台的箱包管家的设计与实现

针对用户在使用旅行箱过程中可能发生的诸多安全问题,基于物联网云平台设计了一套＂易行-更省心的行李箱＂箱包安全监管系统,创新性提出并详细介绍了本系统各大功能模块的实现方

期刊

云平台物联网远程控制智能监控

浅谈小学语文教学存在的问题及教学方法

小学语文教学的目的，是指导学生正确地理解和运用祖国的语言文字，使学生具有初步的听说读写能力；在听说读写训练过程中，进行思想品德教育，发展学生的智力，培养良好的学习习惯。

期刊

小学语文学习兴趣课堂教学

扑尔敏依赖性头痛1例

头痛病因较多，患者服用扑尔敏成瘾所致的头痛在临床上少见。我院治疗了１例扑尔敏依赖性头痛。患者女性，３２岁。自述１年前一次感冒后出现头部持续性闷痛。无颅脑外伤史，经服用感冒药（药

期刊

扑尔敏依赖性速效伤风胶囊谷维素感冒药持续性药治疗恶心呕吐头痛病不良反应

幼儿园户外活动引入民间体育游戏的分析

教育，作为时下的热点问题之一，社会各界的重视程度越来越高，进一步优化升级教育质量已经成为亟待解决的问题。幼儿园教育是教育活动的起点，对幼儿思维模式、习惯的养成具有重要的

期刊

幼儿园户外活动民间体育游戏

浅谈如何提升交通运输行业思想政治工作实效性

随着社会经济的不断发展，我国交通运输行业迎来了新的发展的高峰期，同时，交通行业思想政治的工作的开展，也成为了人们关注的重点，思想政治工作是党的工作的重要组成部分，新时期下，对

期刊

交通运输行业思想政治工作实效性

烟台万华北京研究院：王者之牌

“从安逸的跨国企业跳到压力倍增的烟台万华，从按部就班的欧洲转到充满活力的北京研究院，我寻找到了自己久违的激情与兴奋，这是作为中国聚氨酯行业领跑企业的烟台万华及其北京研

期刊

研究院北京烟台跨国企业聚氨酯行业

浅谈初高中历史教学的衔接——以《辛亥革命》一课为例

教学衔接是指相邻前后两个教学阶段之间在教学内容、教学重点、教学方法等方面的相互联系，有效提高学生的学习效率和质量。随着新课程改革的推进，初高中历史课程标准和内容都出

期刊

初中历史高中历史教学衔接辛亥革命

开元磁材3亿建磁材与电子变压器生产线

近日四川省绵阳市开元磁性材料有限公司分期投入3亿元建设年产6000吨高性能软磁铁氧体粉料生产线和5000万只电子变压器件生产线。项目建成后，公司将实现年销售收入10亿元，成为

期刊

电子变压器生产线铁氧体粉料磁性材料销售收入生产基地绵阳市四川省

我国第二大电解铝企中电投年内产能207．5万t

2009年，中电投集团可控装机突破6000万kW，煤炭产能5015万t，电解铝产能175．5万t，分别增长13％、46％和105％。2010年，中电投集团目标：实现电力总装机7000万kW，煤炭总产能7275万t，电解铝产能20

期刊

电解铝产能装机煤炭

基于深度强化学习的机器人手臂控制

与本文相关的学术论文