DeepMind又出新招!智能体观看视频学会玩游戏

来源 :机器人产业 | 被引量 : 0次 | 上传用户:jack_123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人们可以通过在线观看视频,学习从编织到跳舞再到玩游戏等许多任务,这展示出将从在线演示中所学到的知识迁移到现实任务的能力。人工智能中的智能体能否获得这种能力呢?最近,DeepMind的科学家们提出了一种新方法,通过观看YouTube视频,指导智能体进行探索以赢得难以完成的游戏。深度强化学习方法通常在环境奖励(environment reward)特别稀疏的任务中存在较大的困难。在这些领域中有一个成功的方法能够指导探索,就是去模仿人类演示者提供的轨迹。
其他文献
一家研发移动端应用软件的互联网公司为何与机器人结下不解之缘?这是外界对于猎豹移动的最大好奇点.在“2018世界机器人大会”的舞台上,傅盛回答了这个疑问,在他看来,机器人是
如今,随着技术的发展,人工智能在社会的多个领域有着越来越多的应用.在2018世界机器人大会上,科大讯飞股份有限公司董事长刘庆峰表示,人工智能在不断改变世界,也带来了全新的
如今,随着机器学习、深度学习等先进技术的飞速进步,全球人工智能领域中不断涌现出具有突破性的研究成果。发达国家对于探索大脑奥秘的号角已经吹响,在全球人工智能发展浪潮
目的:探讨血管紧张素Ⅱ1型受体(ATIR)拮抗剂坎地沙坦对鼻咽癌CNE1细胞辐射抵抗性的影响。方法:噻唑蓝(MTT)比色法检测坎地沙坦对鼻咽癌CNE1细胞的生长抑制率;克隆形成实验检测坎地沙
目的比较股骨近端髓内钉(PFN)及动力髋螺钉(DHS)治疗老年稳定性股骨转子间骨折的临床疗效。方法回顾性分析2010年5月至2014年5月,四川省人民医院骨科收治的76例老年稳定性股骨转子
目的:通过观察清营汤加味联合阿维A治疗中、重度斑块状银屑病患者的临床疗效及对细胞因子的影响,探讨其免疫调节作用。方法:选择68例斑块状银屑病患者,随机分为对照组和观察组,每
两年前,傅盛向世界宣告了自己的机器人之梦,一时间,质疑声将他的梦想湮没。随着时光的流失,当人们几乎忘记了他曾经的铮铮誓言时,年过四十的傅盛站上了水立方的演讲台,交出了
目的对比分析中国东北地区和西北地区60岁以上老年髋部骨折的流行病学特点。方法利用医学影像计算机存档与传输系统(PACS)及病案查询系统收集2010年1月至2011年12月东北地区
目的:通过磁共振波谱技术(MRS)以及神经心理学量表观察低频重复经颅磁刺激(r TMS)对脑卒中后执行功能障碍的影响。方法:选取脑卒中后执行功能障碍的患者60例,采用随机数字表
智能网联汽车的发展将引发汽车工业、交通形态、社会分工等方面巨大的变化,同时也必然会对既有的社会秩序和规则带来挑战。法律规则建设是智能网联汽车发展中非常重要的一环