基于深度强化学习的机器人手臂控制

来源 :福建电脑 | 被引量 : 0次 | 上传用户:liongliong431
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度强化学习策略,研究了机器人手臂控制问题。以两节机器人手臂为对象,给出奖励函数和移动方式等。结合深度学习与确定性策略梯度强化学习,设计深度确定性策略梯度(DDPG)学习步骤,使得机器人手臂经过训练学习后具有较高的环境适应性。实验表明基于深度强化学习机器人手臂可以快速并且准确的找到在环境中移动的目标点。
其他文献
一次电子式互感器与变电站实现数字化连接主要通过合并单元来实现。为此,介绍了电子式互感器数字输出接口的重要组成部分一合并单元的定义及其组成,分析了合并单元的功能特点进
针对用户在使用旅行箱过程中可能发生的诸多安全问题,基于物联网云平台设计了一套"易行-更省心的行李箱"箱包安全监管系统,创新性提出并详细介绍了本系统各大功能模块的实现方
小学语文教学的目的,是指导学生正确地理解和运用祖国的语言文字,使学生具有初步的听说读写能力;在听说读写训练过程中,进行思想品德教育,发展学生的智力,培养良好的学习习惯。
头痛病因较多,患者服用扑尔敏成瘾所致的头痛在临床上少见。我院治疗了1例扑尔敏依赖性头痛。患者女性,32岁。自述1年前一次感冒后出现头部持续性闷痛。无颅脑外伤史,经服用感冒药(药
教育,作为时下的热点问题之一,社会各界的重视程度越来越高,进一步优化升级教育质量已经成为亟待解决的问题。幼儿园教育是教育活动的起点,对幼儿思维模式、习惯的养成具有重要的
随着社会经济的不断发展,我国交通运输行业迎来了新的发展的高峰期,同时,交通行业思想政治的工作的开展,也成为了人们关注的重点,思想政治工作是党的工作的重要组成部分,新时期下,对
“从安逸的跨国企业跳到压力倍增的烟台万华,从按部就班的欧洲转到充满活力的北京研究院,我寻找到了自己久违的激情与兴奋,这是作为中国聚氨酯行业领跑企业的烟台万华及其北京研
教学衔接是指相邻前后两个教学阶段之间在教学内容、教学重点、教学方法等方面的相互联系,有效提高学生的学习效率和质量。随着新课程改革的推进,初高中历史课程标准和内容都出
近日四川省绵阳市开元磁性材料有限公司分期投入3亿元建设年产6000吨高性能软磁铁氧体粉料生产线和5000万只电子变压器件生产线。项目建成后,公司将实现年销售收入10亿元,成为
2009年,中电投集团可控装机突破6000万kW,煤炭产能5015万t,电解铝产能175.5万t,分别增长13%、46%和105%。2010年,中电投集团目标:实现电力总装机7000万kW,煤炭总产能7275万t,电解铝产能20