人工智能“邂逅”高考:那一天,机器人来了

来源 :科学中国人 | 被引量 : 0次 | 上传用户:bailong08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  这是一个普通的高考考场:考生就坐,准备就绪,开始答题。
  但这又不是一个普通的高考考场。这里不够安静。在一个大约300平方的大厅里,循环播放着一首钢琴曲,时不时还有女主持人和男嘉宾的对话。大厅一排排的椅子上坐着兴奋而略带焦躁的观众,人们窃窃私语,似乎都对他的解题过程充满兴趣。
  面对音乐和干扰,考生表现出了良好的心理素质。他全神贯注地解題,速度与质量没有受到外界的丝毫干扰。他解开每一道题的速度为7到15秒。据熟悉他的人介绍,这是他放慢了6倍的结果。
  他放慢的原因是:他不仅需要把题目做对,还需要给大家展示他是如何做到的。根据高考要求,他不能直接说话。他也没有多余的手来为观众进行演算。一切只能通过礼堂前部的大屏幕来展示:左边是一个由无数蓝色光点组成的大脑,每算一道题,蓝色大脑里就会跳出若干以红色、黄色、蓝色节点构建的知识链。每个节点旁边有一行白色的字,标注着这道题涉及了哪些知识。
  屏幕的右边是正在演算的题目。蓝色光标在题目末端闪烁,过一段时间打出一行字:那是他给出的答案。答案闪现的飞快,一些观众干脆从椅子上站起来,想看清楚题目以跟上他思考的速度,但往往还没有把题目读完,就已经到了下一道题。
  开始时间是6点40分:这比高考要晚了近5个小时。不过,在这场为他专门准备的考试里,才开始了不到8分钟,而他已经快把题目做完了。
  最终,他答完了题。用时9分47秒。几乎在他答完题目的同时,在2000公里外的成都,另一个与他类似的考生,也已完成了题目。他们使用相似的屏幕输出,做一样的北京市高考数学卷,只不过那一位成都的考生用时要比他稍长些:22分钟。
  经过数学特级老师、奥赛教练韩兆勇的评审,他的分数最终公布:134分。
  为了衡量这个分数的价值,有3组高考状元陪他一起进行测试:状元一组得分,119分。状元二组得分,140分。状元三组得分,146分。最终结果是,他惜败于最精英的人类“做题家”。
  作为国家级项目,“高考机器人”仍在开发和完善之中,要2019年才会正式参加考试。但今年参与考试的“考生”之一准星云学AI-Maths,与该项目有着密切关系。资料显示,准星云学的核心团队于2015年参与了“基于大数据的类人智能关键技术与系统”,并主导子课题“初等数学问题求解关键技术及系统”。后者正是AI-Maths技术的重要来源。除此之外,AI-Maths还综合了清华大学大数据及自然语言识别等前沿技术,是“一款以自动解题技术为核心的人工智能系统”。
  而另一个“考生”Aidam,则来源于学霸君。此前,学霸君接受采访时曾经描述,教育中清楚地分析知识点,做到知识框架全局可细分就需要用数据来驱动学习效果,而数据则来源于学生使用学霸君时的各种行为记录。
  在讲解Aidam的背后逻辑的时候,学霸君的首席科学家陈锐锋使用了围棋作为比喻。类似于围棋棋盘可以被分为无数横轴和纵轴,人的思维模式和解题模式也可以被具象为棋子,棋子的纵轴与横轴分别代表起始的状态和下一步的状态,这样,每一次题目的可能解法,就相当于在一个庞大思维矩阵里下棋的过程。而学霸君此前积累的庞大的题库与数据记录,恰恰类似于无数张围棋棋谱,为人工智能自主学习提供了可能性。“我发现,原来在我们的题库里面我们记录了大量的关于状态之间可跳转、可推演、可演算、可关联的信息。”   不同的背景决定了二者不同的解题思路,甚至在一定程度上截然相反:准星云学的AI-Maths与“863”计划的高考机器人的思路一致,强调“不联网、不连接题库、无人工参与”,在只有少量训练样本的情况(只有约500套试卷、1万道题的训练量)以机器建立类似人类的复杂逻辑推理能力与联想能力,试图让机器在较少样本和较少资源耗费的情况下,拥有“举一反三”能力。而学霸君的思路则强调大题库(已经有超过7000万的巨大题库),通过海量的题库、用户行为数据,以及AI自我博弈,从海量题目中找到适合共通的知识元件和解题模式。从某种角度说,这两种模式的区别类似于AlphaGo早期版本的学习过程,计算机可以通过规则自己对弈,也可以学习棋谱。从此前的测试中看,Aidam的成绩要好于AI-Maths,但如果以纯粹人工智能的难度和多行业的延展性,AI-Maths要略高一籌。
  不过,尽管距离人类并不遥远,但无论是AI-Maths还是Aidam,仍然有很长的路要走。
  尚有很长的路要走
  在4个月前的那次首次亮相中,AIMaths仅得了93分。事后,准星云学CEO林辉在接受记者采访时,认为它失分的重要原因来源于“无法理解题意”,它们缺乏人类生活的常识,它们无法理解“投资”“理财”这些概念。
  在现场AI-Maths的研究人员举了一个例子:它可能能够解决复杂的数学问题,因为1?9的数字对它理解起来非常很容易。但是人工智能要理解“苹果是什么”却很难,因为一个具象苹果,需要非常多的描述。人类可以从小从生活经验里习得,而AI则不能。这也导致了,在语言相对更复杂,概念更多的应用题领域,AI的难度要比人类解题大得多。
  这一问题同样困扰着Aidam的开发者。陈锐锋简要介绍了AI的答题过程必须经过三步:第一步,从自然语言转为形式语言,需要将复杂的数学题分析其中的语法结构,抽出其中的主谓宾,形成能够让AI理解的语句;第二步,从形式语言进行自我映射、自我推理,并完成最终解题过程;第三步,将解题完成后的机器语言翻译回人类的语言。仅在解决“如何将几何语言转化为机器语言”这一难题上,开发者就花费了整整一年的时间。此次的题目也是由人手工输入,在一定程度上降低了AI解读的难度。
  但从整个AI行业而看,AI对语言的理解,乃至对于主观题的判断,又比人们设想的更加迅速。据吴晓如在访谈中介绍,目前科大讯飞的智能阅卷产品,已经可以实现对主观题,甚至对语文、英文的作文题都可以实现自动评分,包括给出详细批语,甚至可以对学生们用的好的一些优秀的排比句,和名人名言给予针对性的鼓励和评点。另一方面,微软小冰在2017年5月19日出版的诗集《阳光失了玻璃窗》获得好评,被认为比起去年的高考作文有了很大的进步。
  从以往的技术发展进度看,人工智能从第一次走进高考考场,到最终攻克应用题和语义理解难关,获取较为优异的高考的各科分数,到最后考入清华和北大,只是时间问题。或许真正的问题是,之后人们如何与人工智能相处,乃至借助AI的力量,让教育变得更有质量、更个性化,也更加公平。例如此次的两家公司:学霸君和准星云学,其技术都包括了自动批改、智能评测、学习诊断等功能,这也逐渐成为目前的“AI 教育”类产品的标配。
  这不禁让人联想,2017年是中国恢复高考制度40周年。这40年,高考制度成功的打破了原有的社会壁垒,改写了无数中国人的命运。那么下一代,AI走入教室和考场,又会改变哪些人的命运呢?
其他文献
介绍了土工合成材料的功能,论述了土工合成材料在加固软土路基中的应用原理和解析计算方法,并引入筋土作用系数的概念进行解析计算.在分析加固软土路基的基本理论和评价计算
为改善聚丙烯酰胺凝胶(PAM)在吸水/脱水过程中对环境变化的响应性,制备了多孔聚氨酯弹性体(PU)与PAM的互穿网络结构(IPN),测试其在吸水/脱水过程中的质量和体积变化,并与PAM
文章简介了地方党政主要领导干部经济责任同步审计内容及特征,分析了当前我国开展地方党政主要领导干部经济责任同步审计工作的难点与制约因素,结合各地方党政工作实际,提出了加
摘 要:高校作为以财政拨款为主的事业单位,必须按照上级的精神,积极开展“三公经费”的审计,并以此为契机,进一步提高高校内部管理水平。文章就此展开深入研究。  关键词:高校 “三公经费” 审计 内部管理  中图分类号:F239  文献标识码:A  文章编号:1004-4914(2014)07-137-02  2012年底,中共中央在审议改进工作作风、密切联系群众“八项规定”会议上要求,各级纪检监察机
目的研究不同污泥性状在膜生物反应器中对有机污染物去除率的影响.方法试验以自配的高质量浓度有机废水(COD,500~1100mg/L)为研究对象,间歇曝气连续运行,检测不同条件下反应器中污泥
目的:研究双氢青蒿素(Dihydroartemisinin,DHA)对人骨肉瘤143B细胞裸鼠移植瘤肺转移的抑制作用及机制探讨。方法:将人骨肉瘤细胞143B接种于Bblb/c裸鼠股骨骨膜下,建立骨肉瘤模型。再
本文通过对100例肾脏占位病变CT征象的分析,证明CT对于肾脏占住病变的定位及定性不仅明显优于静脉肾盂造影及B超检查,而且还可清晰显示病变与周围组织器官间的关系,这对于治疗方案的选择
研究了白檀油的理化性质和以该油制备生物柴油的工艺。结果表明:白檀出油率为20.0%;白檀油是以含棕榈酸、硬脂酸、油酸、亚油酸和亚麻酸为主的油脂,其中不饱和脂肪酸质量分数高达7
分析42例脑脓肿的CT 表现,多数病例表现典型,少数表现不典型,须与其他病例鉴别。动态观察对本病的正确诊断有帮助。
期刊
本组对男女偏头痛患者血液流变学指标进行检测,与健康对照组对比,其中多数指标差异有显著性(p<0.01)(36.9%)。本组122例中血液流变学指标异常者79例(64.9%)。对部分病例进行