学了后面忘前面,AI“健忘症”也难治

来源 :大众科学 | 被引量 : 0次 | 上传用户:leiguo152
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  很多人在上学的时候都有这样的经历,在经过了一个寒假返校后,发现前一学期学到的内容有的已经忘了。在见识过人工智能PK人类的屡屡胜绩后,有人不免羡慕AI强大的学习本领,但事实上人工智能的“记性”并不如你想象的那样好,如果你像人工智能系统那样学习,很可能在学习新知识的同时,大脑便会逐渐忘了之前的内容,其原因就在于人工智能遭遇了“灾难性遗忘”。
  近日,来自谷歌大脑的最新研究发现,在街机学习环境的由多个子任务组成的单任务场景中也存在着“灾难性遗忘”。特别像在“蒙特祖玛复仇”这种探索型游戏里,场景变化较大,会出现学习完当前游戏场景后,忘记上一个游戏场景知识的情况。
  那么人工智能为什么会产生“灾难性遗忘”?目前解决“灾难性遗忘”的方案有哪些?难点在哪?

学一个忘一个 深度学习效率低下


  自从阿尔法围棋相继战胜多名围棋冠军后,深度学习已经成为众多实现人工智能的方法中最耀眼的“明星”,也是各大研发机构角逐的主战场。但是“灾难性遗忘”,正是人工智能深度学习中所面临的一个普遍且严重的问题。
  “灾难性遗忘”指的是人工智能系统,如深度学习模型,在学习新任务或适应新环境时,忘记或丧失了以前习得的一些能力。“灾难性遗忘”会造成人工智能系统在原有任务或环境中的性能大幅下降。
  在深度神经网络学习不同任务的时候,相关权重的快速变化会损害先前任务的表现,通俗来说,就是在学习中像猴子搬苞谷,捡一个丢一个,记住了新知识,也有可能会忘掉了老知识。
  正是源于此,“灾难性遗忘”的存在,一定程度上限制了人工智能在一些场景中的应用。如一个AI图像识别系统,当需要添加一个新的类别的物体时,就不得不把原先的所有物体都再学习一次。如在文物鉴定系统中,当有一天发现原始数据中有一个文物朝代错了,便没办法单独对这一个错误的文物进行修改学习;再如让AI系统学习英语之后,再让它学习德语,它可能会把原来学习的英语语法全部忘光。
  那么在谷歌大脑的最新研究中,“灾难性遗忘”又造成了哪些影响?其中又有何新发现?
  “除了传统的新知识学习会覆盖旧知识之外,这次谷歌大脑还发现,在如‘超级玛丽’等探索型游戏里,‘灾难性遗忘’会阻碍模型对新知识的学习。”厦门大学科技处副处长、人工智能系教授纪荣嵘说。
  纪荣嵘进一步解释说,面向街机游戏学习的强化学习方法都会采用“经验回放”的训练方式,就是将模型在游戏探索时候的片段进行保存,然后给模型进行“回放”训练。而像“蒙特祖玛复仇”这种游戏,游戏场景变化比较大,模型需要不间断探索游戏场景,因此,在训练时候就必须不断回放早期场景的游戏经验,不然会因为“灾难性遗忘”而忘记了早期的游戏知识。
  “这也导致了新的游戏经验虽然能够被采样到‘经验回放’库里,但因为学习方式的设定,导致学习效率低,同时由于不同阶段的学习会互相干扰,使得AI无法一次通过该游戏的全部关卡。”纪荣嵘说。

AI“脑容量”存上限 新旧知识难共存


  AI为什么会产生“灾难性遗忘”?
  因为深度学习的结构一旦确定,在训练过程中很难调整。神经网络的结构直接决定学习模型的容量。AI“脑容量”存在上限,也就导致了人工智能只能有限地处理特定任务。就像水桶一半高的地方有个洞,以至于无论怎么增加水桶的高度,这个水桶只能装一半高的水。
  中科院自动化所脑网络组研究中心研究员、模式识别国家重点实验室副主任余山指出,这还涉及到神经网络学习知识的机制。在单个任务的训练过程中,网络中各个神经元之间的连接权重进行了专门的调整,以胜任当前的任务。而在新任务的训练中,连接权重要针对新任务进行调整,这将“抹去”适应旧任务的原有结构,导致在旧任务上的性能大大下降。
  人类的记忆能力其实是有限的,但为何出现“灾难性遗忘”的情况却比较少?“主要是人类在学习过程当中,大脑能够主动保留有用的知识和技巧,同时不影响新的信息获取。” 纪荣嵘说,但现在的人工智能模型大部分是基于随机梯度下降来更新模型参数,这个过程主要服务于当前任务的优化,并不会去评估哪些参数权重对旧的知识是有用的,所以就很容易出现知识被覆盖的情况。
  纪荣嵘也表示,当前像Siri或小爱这样的人工智能助手產品,还不能算真正意义上的通用人工智能,一方面,这些人工智能助手只能在预设的知识范围内和人类互动,完成指令;另一方面,人类没办法像养宠物或养小孩一样,通过互动去教导这些人工智能助手学习新的知识或新的指令。

有多个解决方案 但都治标不治本


  据了解,破解“灾难性遗忘”是实现通用人工智能的一个关键。解决了“灾难性遗忘”问题,就意味着模型具备了持续学习的能力, 可以像人类一样不断获取新的知识、新的技能,同时能够最大化地保持旧的经验知识和技巧。
  那么,目前解决“灾难性遗忘”的方案有哪些?
  “最常见的方式是多任务学习, 就是把所有任务的训练数据同时放到一起,模型就可以针对多种任务进行联合优化。”纪荣嵘举例说,如让模型同时学习“坦克大战”和“超级玛丽”两个任务,等两个任务同时学的差不多的时候,模型才停止训练。
  但这种方式随着任务增多,新任务样本数量被稀释,训练会拖慢学习新知识的效率,并且不是任何情况都能获得先前任务的数据来复习的。
其他文献
从增强混凝土抗渗透性和降低收缩的角度出发,通过开展两类减水剂的混凝土塑性至硬化期收缩对比试验、粉煤灰对混凝土干缩性能和氯离子渗透性能试验以及防腐阻锈剂对混凝土钢
本文首先论述了金融自由化的条件、速度、顺序及金融自由化过程中的金融监管等四个基本问题;在此基础上,结合20世纪90年代初期中东欧转轨国家金融自由化的实践,将其金融自由
本文是一篇事理说明文。主要说明了花的特征、花与昆虫的关系,以及人们爱花的原因。文章内容比较易懂,教学重点应放在指导学生领会全文的说明顺序,即按逻辑顺序安排组织材料的行
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在铁路选线过程中经常会遇到大中小型既有水库和类型不等的各类规划水库,铁路选线如何通过水库往往是铁路选线者必须认真研究和严肃对待的问题,稍有疏忽或处理不当就会出现严重
分析与诊断男子背向滑步推铅球最后用力阶段技术参数,对提高我国男子铅球运动水平具有重要意义。文章选定2004年“菲普莱杯”全国田径大奖系列赛(南京站)男子铅球比赛前6名运动
IPO即公司首次发行上市,是上市公司在资本市场上进行融资的重要方式之一,也是广大投资者所熟悉的投资方式,IPO公司公布的盈利预测信息作为投资者投资决策的重要依据之一,对其
目的 观察自拟活血化纤汤对慢性肝炎患者肝纤维化指标的影响。方法 采用自拟活血化纤汤治疗肝纤维指标明显异常的慢性肝病患者30例,并与非中药治疗组对照。结果 治疗组病情及
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield