论文部分内容阅读
[摘 要] 结合丰富的应用场景和案例,梅宏院士阐述了大数据技术的主要内涵、发展历程以及对信息化社会的影响。他指出:当前的大数据应用尚处于初级阶段,需理性认识;与人工智能相结合,将更好地实现智能化应用。聚焦教育领域,分析了大数据对教育教学各个环节可能产生的变革性影响;关注对“个体数据”的深层次挖掘真正做到“因材施教”;强调大数据所催生的教育研究新范式及对未来社会教育服务模式、教育决策等方面的影响,推进社会治理效能的提升。梅宏认为,“懂得大数据,用好大数据”,将是数字经济时代对人的基本素养和能力需求。更好地面对大数据驱动的智能时代,要培养具有引领能力的人才。应加强计算思维培养,加大软件人才培养,做好人才储备。
[关键词] 大数据; 教育变革; 教育公共服务; 教育治理; 计算思维
[中图分类号] G434 [文献标志码] A
[作者简介] 沈阳(1985—),女,安徽宿州人。助理研究员,博士,主要从事智慧教育、智慧学习环境等研究。 E-mail:[email protected]。
一、大数据技术的发展及面临的挑战
访谈者:梅院士,您好!非常感谢您拨冗接受我们的采访!您是大数据领域的著名专家,先请您给读者介绍一下大数据技术的主要内涵、发展历程,以及对信息化社会带来的影响。
梅宏:数据在我们人类社会发展过程中一直扮演着非常重要的角色。文明之初,“结绳记事”是我们记录数据的一种方式;文字发明以后,“文以载道”,记录了人类发展史;到了近现代,“数据建模”成為我们认识客观世界的一种科学方法。如今,随着信息技术与通信技术的发展,特别是过去20多年互联网的快速发展和应用,人类社会迈入大数据时代,全球数据呈现爆炸式增长的趋势。按IDC(国际数据公司)的估算,全球数据总量在2030年可以达到2500ZB(1ZB=1021字节),而这一数据在2009年仅为0.8ZB。
大数据是信息技术革命与经济社会活动相互碰撞、交融的产物。所谓大数据,并非仅仅表现为数据量大,更多体现在数据的多源(元)。大数据指的是规模巨大到无法通过现有数据库工具在合理时间内获取、存储、管理、处理和整理的数据集,具有海量性、多样性、时效性及可变性等特征,需要通过可扩展、高性能的计算平台高效地存储、处理和分析。
在信息化的发展历程中,主要经历了两个高速发展的阶段,我们分别称之为:信息化1.0和信息化2.0。信息化1.0发轫于20世纪80年代,随着个人计算机进入市场,带来了以单机应用为主要特征的数字化浪潮。随后大约历经十多年的技术发展,信息化2.0初露端倪。也就是在 20世纪90年代中期,互联网的大规模商用,推动了以联网应用为主要特征的网络化浪潮。而当下,开启信息化3.0帷幕的正是大数据技术。随着数据量的积累与各行各业的交叉融合,我们已经迈入并正在迎来以数据的深度挖掘和融合应用为主要特征的智能化阶段。并且,随着5G、物联网、人工智能、云计算、虚拟现实等高新技术组合创新、赋能社会的大背景下,“人、机、物”三元融合成为必然,以“万物均需互联、一切皆可编程”为目标,数字化、网络化和智能化进程呈融合发展新态势。
大数据的发展承载了人类信息科技的进步,也深刻地改变了我们的工作和生活。AlphaGo先后击败世界围棋冠军李世石和柯洁,攻克了人类在棋类的最后一个“智力堡垒”;通过大数据技术对奥斯卡奖项的归属进行预测,准确率高达87.5%;基于购物大数据,则可以对用户信用、购物习惯等进行分析,通过精准推荐或快速信贷等给人们带来更大的便利,等等。当前,已经出现了大量成功的大数据应用实践。作为信息化进程的新阶段,大数据给我们提供了认识复杂系统的一种新手段、新思维。从信息技术发挥的作用看,如果说过去更多是作为各个行业提质增效的工具,扮演辅助者的角色,在大数据时代,信息技术将成为变革者、引领者,引领社会经济的发展。大数据的发展推动了数字经济的形成与繁荣,这是继农业经济、工业经济之后的崭新经济形态,数据是其中重要的生产要素。
访谈者:媒体上的宣传热潮之后,我们应该怎样理性认识“大数据”?大数据研究面临怎样的挑战?
梅宏:大数据逐渐成为研究和实践的热点,吸引了众多企业、风险投资和研究者的关注和进入。大数据作为战略资源的地位已成为高度共识。2012年,全球大数据产业初见雏形;2013年,对大数据的宣传达到顶峰;2014年,大数据产业结构逐渐成形,对其认识也趋于理性。如今,全球对待大数据的态度已趋客观和理智。相对而言,我国和国际上存在3~5年的时差。
然而,当前大数据的发展也存在很多短板和制约因素,需要我们审慎地加以理性认识。例如:我国的数据治理体系远未形成;隐私保护和数据共享开放之间的矛盾突出,导致数据壁垒;相应的法律法规体系尚未建立健全,大数据场景应用难以规避安全隐患、隐私风险等伦理问题。
当大数据应用超前于相应的理论和技术发展,往往缺乏坚实的理论对数据分析结果进行支撑,未必符合预期或者具备严谨性和科学性,那么,我们对这些结论的使用就需保持谨慎态度。前面我提到,大数据基础理论的研究仍处于萌芽期,尽管我们对大数据定义已达成初步共识,但在数据驱动与规则驱动的对立统一、关联性与因果性的辩证关系、“全数据”的时空相对性、兼顾分析模型的准确性与可解释性等诸多深层次、本质性问题上仍存在争议。
前面,我举例说明了数据体量和规模在几何级高速增长,但囿于信息技术在未来一段时期内将保持稳步渐进的发展态势,对数据的处理能力提升速度就显得相对滞后,所以说,大数据现象将会长期存在。反过来,大数据现象也将倒逼技术变革,加速信息技术体系的重构。例如,对计算机体系结构来说,带来了“以数据为中心”的宏观走向和“存算一体”的微观走向等。同样,大数据现象延展到其他各个领域,对信息技术体系的变革都可能是一场颠覆式的生态重构。因此,大数据研究的挑战是方方面面的,需要建立在深度的多学科交叉和“产—学—研”高度融合基础之上。 访谈者:为什么您说当前的大数据应用尚处于初级阶段?如何更好地推动基于大数据的智能化应用?
梅宏:大数据应用可以分为三个层次:第一层是描述性应用,从数据中抽取知识和信息,并刻画事物的发展态势;第二层是预测性应用,通过对事物当前的现状进行描述,分析关联关系、发展模式,预测其未来的发展趋势;第三层是指导性应用,对不同的预测结果进行权衡,为最终决策的优化与指导提供依据。
从总体情况来看,当前的大数据应用仍存在如下问题:首先,实践中的应用大多属于描述性和预测性,而指导性应用这类深层次的应用偏少;其次,目前的数据源仍旧较为单一,彼此之间相互关联的多源多模态数据较少;另外,模型导向的应用较多,面向实际需求构建模型的应用较少。这些问题表明,虽然我们在大数据研究和实践方面取得了许多可喜的进展,但是仍旧具有较大的提升空间,大数据应用仍然处于初级阶段。
大数据的智能化应用本质上是数据驱动的智能,是人工智能方法和技术在“大数据”上的应用呈现,进一步的发展需要大数据基础理论和方法上的新突破,也需要人工智能方法和技术的新进展。谈到人工智能,对大众来说,由于受到媒体、影视的渲染,人工智能充满着科幻色彩。实际上,人工智能是一门多学科交叉融合的科学,当前人工智能所取得的成功离不开大数据的应用。早期的人工智能走的“规则驱动”路径,即通过构建事实库和规则库,借助逻辑推理来实现智能,然而,这个途径并未能达成其最初宣称的目标。当前的人工智能可归为“数据驱动”的路径,基于海量的数据集,通过统计分析或机器学习等各类算法从数据中分析、挖掘现象和规律,从而产生了很多具有实用价值的应用,带来了人工智能的新一轮热潮。
当前数据驱动的智能也存在不少问题,具体体现为三“大”:大模型,动辄涉及数百万、甚至数十亿的模型参数;大系统:以算力拼智能;大数据:以数据换智能。因此,其应用效果也就显得低效、不通用、不透明、鲁棒性差。数据和智能是体和用的关系,数据为体、智能为用,打一个不是那么严格准确的比喻,就像燃料与火焰的关系,燃料越多,火焰越旺,燃料越纯,火焰越亮。
从软件实现的视角来考察,大数据的智能化应用可以分为三个层次。第一层次是早期人工智能的做法,即软件系统+知识库,这里知识库事先由人构建好,其完善扩充也需人工完成;第二个层次是当前数据驱动的智能途径,即软件系统+自演化的知识库,知识库的自演化需要“学习”能力,这仍是当前努力的方向;第三个层次应该是自演化的软件系统+自演化的知识库,希望软件系统能够自我完善,甚至自动构建,当然,我们距离这个目标还有很长的路要走,目前学术界围绕软件自动化已经开始了一些探索。
二、大数据时代的教育
访谈者:大数据在教育中的应用场景可能有哪些?大数据技术的应用会对我国教育事业的发展产生怎样的影响?
梅宏:党的《十九大报告》明确提出:“建設教育强国是中华民族伟大复兴的基础工程,必须把教育事业放在优先位置,深化教育改革,加快教育现代化,办好人民满意的教育。”[1]尤其是,“中国教育现代化2035”规划的我国教育战略,是赶超世界先进教育水平的重要战略部署,为了加快教育现代化、建设教育强国的进程,需要充分运用新理念、新模式、新技术激发教育创新能力,培养适应时代发展的创新型人才。大数据作为当前新一代信息技术发展的重要领域,也应成为新一轮教育创新和教育重大变革的重要推手,成为实现教育现代化宏伟目标的重要动力与支撑。
谈到大数据在教育领域的应用场景,由于我不是研究教育的专家,也未曾从事过教育信息化方面的工作,因此,相比专业从事相关研究和实践的学者,可能难以细化和具体化,只能从一个普通教育工作者的角度,谈一些认识。前面提到,大数据给我们提供了认识复杂系统的一种新手段、新思维。我想,教育本身就是一个极其复杂的系统,无论是教育的过程,还是参与其中的个体或组织。理论上,透过教育的信息化(数字化、网络化、智能化)及其产生的教育大数据,我们可以形成相对应的洞察,从而更好地把握其本质和规律。基于这个观察,大数据在教育领域的应用,将会贯通于教学模式、手段、环境、管理、评测等多个环节。大数据技术的应用,将深入推动教育教学、教育评价、教育服务、教育治理、教育决策等全方位、深层次的变革转型。
从微观层面,大数据的应用可能会对未来的教学模式、教学评价等环节产生影响,例如:
在教学过程中,利用信息技术手段记录下教与学过程中的详细行为数据,可以更加精细地刻画和分析教师与学生的实时状态,并诊断与预测师生在教与学过程中存在的问题,进而依据不同个体的自身状态,实时调整教学内容与进度,实施精准的个性化教学。
在教学评价方面,通过跟踪学生学习的过程、记录学生全方位的行为数据,从而建立一个更加全面的教学评价体系,使教学评价不再仅仅注重学生的学习成绩,而更加注重对学生综合能力与成长状态的评价,从而促使评价更加依赖于客观数据,评价维度更加多元和全面,也更加注重对学生学习过程的考察。
大数据的深入应用也催生了很多新型的教学手段。如,利用基于大数据训练的智能引擎,实现机器辅助的自我训练与学习,已逐渐成为一种有效的教学方式。在外语学习过程中,帮助学习者及时识别并纠正发音错误;在写作训练中,帮助学习者及时发现并纠正书写中的错误等。这些新型教学手段的出现,使得“人与机器”的互动学习成为“人与人”传统教学方式的重要补充。此外,MOOC、SPOC、个性化学习、学习路径推荐等新理念、新方法也不断促进教育教学改革,大数据技术在教育改革和人才培养中发挥的作用将会越来越重要。
从宏观层面,大数据的应用也可能会对未来社会的教育服务模式、教育决策等方面产生影响。例如:
随着时代的进步,人们学习的发生场景也越来越多,并呈现出碎片化的趋势,利用大数据可以对学习者在不同场景中的行为模式和学习规律进行分析,从而更精准地发现隐藏在数据中的教育现象或规律,进而可以为学习者提供更为客观和精准的个性化教育服务,促使教育服务转向“基于场景的精准化、个性化服务模式”。 在教育决策方面,在大数据的支持下,可以对每个参与教育的个体进行伴随式数据采集,在此基础上对来源于不同地域、不同时段、不同场景的多元教育数据进行分析,能够使决策者全方位充分了解教育现状,从而为教育主管部门与监管机构提供制定政策所需的决策依据。
科学研究经历了实验归纳、模型推演、仿真模拟三类范式,大数据催生了科学研究的“第四范式”,即数据密集型研究范式。教育研究范式也会因大数据的应用而发生重要变化,催生“大数据驱动的教育研究范式”。传统的教育研究范式偏重于基于经验的定性研究和基于局部抽样的定量研究,难以全面准确地发现隐藏在数据中的现象和规律,而教育大数据中蕴含着大量有意义的教育规律和教育模式,关键在于以合适的方法、技术和成本对其进行深层次挖掘、分析和应用。
教育大数据为教育变革提供了新的思路和技术支撑,在全方位推动着教育变革的同时,也将催生适应时代发展的新型教育治理体系。充分利用大数据的思维、方法对海量教育数据进行分析应用,为教学活动、教学评价、教育服务、教育决策等教育事务,构建一个以大数据为基础的现代化教育治理体系。同时,我国也高度重视教育信息化的基础设施建设,国务院发布的《促进大数据发展行动纲要》中明确提出完善教育管理公共服务平台,推动教育基础数据的伴随式收集和全国互通共享;推动形成覆盖全国、协同服务、全网互通的教育资源云服务体系等重要举措[2]。
访谈者:在充分重视和发展大数据技术,运用大数据的同时,是否也有必要关注教育参与者的“个体数据”?如何处理教育大数据和“个体数据”的关系?
梅宏:站在整个教育领域的高度,教育大数据往往是反映教育服务模式、总体需求等方面的规律,然而,“个体数据”作为教育大数据的不可或缺的组成部分,反映着学习者的个体行为模式、心理情绪状态和感知/认知方式等,结合个体数据对教学活动的需求、内容、模式进行深层次细分设计,能够使教学内容更加贴近个体需求,使教学过程更加个性化。
在宏观层面上,通过教育大数据的描述性、预测性、指导性分析,发现群体行为规律和总体需求,能够为教育决策层提供客观、科学的依据;在中观层面上,利用教育大数据得到的群体规律和总体需求,结合师生个体的数据特性,分群体、分层级地监控、管理和优化教学过程,能够为教育管理层提供科学、有针对性的教学决策和教学设计;在微观层面上,基于教育大数据的数据模型,融合学习者的“个体数据”的深层次挖掘,为每位学习者构建面向个体的学习诊断、预测、干预等教育模型,可以提供个性化的学习支持服务,真正做到“因材施教”。
教育家苏格拉底曾经说过:“教育的本质是唤醒,是开发你的内心。”教育的初心是培养人和发展人,最终是落实到学习者的个体发展上。在这个意义上,社会中每个教育参与者的“个体数据”,包括行为模式、生活习惯、学习规律等,应该得到足够的关注。
访谈者:智慧城市建设离不开大数据技术,请您对智慧城市建设中,教育公共服务数据治理方面给出一些建议,好吗?
梅宏:教育公共服务是智慧城市建设的重要内容,如何构建一个适应未来城市发展的教育公共服务体系是未来城市建设迫切需要解决的问题。智慧城市具有数据全面感知与记录、资源体系协同共享、信息智能处理等特征,使得人们的生活越来越数字化。可以说,“生活数字化” 是智慧城市的重要特点,数据产生于人类社会的各种活动中,从这个意义上说,智慧城市是以“大数据”为核心的新型城市,智慧城市的教育公共服务也旨在打造以“大数据”为核心的新型教育公共服务体系。
通过大数据与教育的深度融合,将大数据深度融入日常的教学活动、教育评价、教育管理与决策等关键环节,推进教育公共服务在内容、模式、形态、质量监控等方面的现代化治理进程:服务内容上,构建虚实融合的多维度、多粒度教育服务内容供给体系;服务模式上,构建面向不同场景与需求的个性化教育服务模式;服务形态上,构建大规模社会化协同的公共教育服务形态;服务质量监控上,构建基于大数据分析的实时服务监测与质量分析服务。这种新型的教育公共服务治理模式,将改变传统的僵化封闭式的教育公共资源与服务治理方式,实现传统的教育公共服务模式与基于大数据的教育公共服务模式的互补,进而能够加快推进我国教育治理现代化的进程。
党的十九届四中全会对坚持和完善中国特色社会主义制度、推进国家治理体系和治理能力现代化进行了新的战略规划,即到我们党成立一百周年时,在各方面制度更加成熟、更加定型上取得明显成效;到2035年,各方面制度更加完善,基本实现国家治理体系和治理能力现代化[3]。其中,社会治理体系的建设无疑是重要的内容,提升社会治理效能,需要分层次、多维度推进,更需要大数据的助力。智慧城市建设作为我国城市建设的新阶段,是基于城市大数据的社会治理体系的重要承载。
三、加强计算思维能力培养,加大软件人才
队伍培养,为大数据时代做好人才储备
访谈者:大数据驱动的智能时代正在来临,我们的人才储备应该作哪些适應性调整呢?
梅宏:在信息化的新阶段,在数字经济的时代,我们每一个人都需要“懂得大数据,用好大数据”,可以说,这将是数字经济时代对人的基本素养和能力需求。为了更好地面对大数据驱动的智能时代,重点是要培养具有引领能力的人才[4]。
随着大数据对人类社会和现实世界的渗透力越来越强,影响面越来越广,受其辐射和影响的人群也越来越多,并随之产生了一系列在伦理、可信、隐私保护、安全等方面的新问题,大数据与人类社会间的关系变得更为紧密,大数据教育需要普及化和全民化。
随着计算平台不断向物理世界和人类社会快速延伸,大数据作为连接物理系统和社会系统的桥梁作用日趋重要,大数据正逐渐成为诸多行业和领域解决其特定问题的核心手段和必不可少的工具。这些行业、领域的专业人才需要掌握大数据分析的基础知识和核心能力,学会运用相关工具来解决特定领域的问题;同时,大数据专业人才也需要向特定领域扩展和渗透。 當前,我国已有近500所高校开设了数据科学与大数据技术本科专业,开展人才培养和储备的相关工作。
访谈者:什么是计算思维?您认为针对不同人群的计算思维培养应注意哪些问题?
梅宏:计算思维是信息社会中现代人的基本素养,也是人类诸多认知能力的核心要素之一。从内涵上看,计算思维是运用计算机科学的基础概念和逻辑去理解问题、分析问题和解决问题的思维方式。计算思维能力绝不仅仅是编程技能,也不纯粹是掌握某些程序设计语言,它还包括创造软件来解决问题的能力,以及由此所需的其他创新思维能力。现阶段软件已经渗透到自然科学、工程技术、社会人文等方方面面,计算思维与其他认知能力相互作用,相互影响,不可分离。
计算思维培养的受众对象涉及面广、差异性大,来自各行各业,知识背景各不相同,认知能力千差万别,且需面对从儿童期到少年期、青年期、中年期甚至到老年期各个不同时期的人群。针对不同的受众对象,他们在计算思维等认知能力的成长方面具有不同的规律性,因此计算思维的培养模式不能单一化,教育方法不能统一化。对于儿童和少年,通过游戏编程、可视化和实物编程等方式,有利于推动以计算思维为核心的认知能力的逐步形成和深化,这需要师范类院校的引领,需要加强K-12阶段的计算思维课程的开发与设计;对于青年,通过创新思维与软件核心认知能力的紧密融合,能够有效推动其认知能力的提升,这是高等教育改革中需要关注的问题;对于成年人,通过软件创意创作来沉淀和累积个人智慧,是发挥其个人特长的有效方法,这可能成为研究生教育、职业教育的新命题;而对于老年人,无处不在的泛在学习、终身学习理念正深入人心,在未来编程很可能成为老年人的另一个重要的兴趣方向。与此同时,随着信息技术的发展,教育的方式和方法也在不断地改变。相应的,计算思维的培养也需要寻求适应不同年龄段、不同行业领域、不同认知水平的学习对象的教育理念和方法。
访谈者:您提到这个时代是一个“软件定义的时代”,请您谈一谈我国应怎样实施软件人才的培养战略?
梅宏:我们正在进入一个新的时代,人们从基础设施、计算模式、信息资源、信息应用等不同的视角将其称为“互联网+时代”“云计算时代”“大数据时代”“智能化时代”等,然而,从一个软件研究者的视角,我理解,在这些称谓的后面,一定离不开软件!软件和芯片是构建信息化社会的基本元素。软件是信息基础设施的重要组成部分,是计算模式的实现载体,是信息资源的管理者和处理者,也是信息应用的呈现形式,从这个意义上讲,软件是这个时代的使能技术,这将是一个“软件定义的时代”。
随着软件学科边界的不断拓展,软件内涵持续演化,它对人类社会的影响面日益扩大,相应的,软件学科教育的重要性也日益凸显。如何加强软件学科教育,提高人才培养的质量和水平,成为全社会关注的话题。
过去两年来,我和国内的软件界同行承担了中国科学院和国家自然科学基金委联合资助的软件学科发展战略研究项目,在回顾软件学科发展历程,展望软件学科未来挑战和发展趋势的同时,也涉及了未来软件人才培养的议题。我们认为,应该注重开展以下方面的工作:
推行以“计算思维+创新思维”为核心的普及性教育,包括积极推行与软件学科核心认知能力的成长模型和规律相对应的知识体系,积极推行以计算思维为核心、融合创新思维的系统化认知能力培养方法,积极推行适应不同认知水平且贯穿终生的软件学科普及教育方法。
推行以“多学科交叉融合知识体系+系统能力和解决复杂工程问题能力培养”为核心的专业教育,包括建立面向多学科交叉融合的软件学科专业教育的知识体系,建立软件学科专业教育核心能力的培养方法。
推行以“专业学科知识+软件学科知识”为基础,实现复合型、创新型和跨界人才培养的其他学科专业教育,包括建立基于“专业学科知识+软件学科知识”的其他学科专业教育知识体系,建立具有软件学科知识和能力的复合型、创新型和跨界专业人才培养方法。
开展以“探究成才规律+寻求理念创新+开发支撑软件”为核心的教育方法改革,探索软件学科人才培养模型及规律,研究软件学科资源在人才培养中的应用方法,推进群体化学习和大规模在线开放实践(MOOP),研发软件学科教育的支撑软件。
[参考文献]
[1] 习近平.决胜全面建成小康社会 夺取新时代中国特色社会主义伟大胜利——在中国共产党第十九次全国代表大会上的报告[DB/OL].[2017-10-27]. http://www.xinhuanet.com/2017-10/27/c_1121867529.htm.
[2] 国务院.关于印发《促进大数据发展行动纲要》的通知[DB/OL]. [2015-09-05]. http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[3] 新华网.中国共产党第十九届中央委员会第四次全体会议公报[EB/OL]. (2019-10-31)[2020-05-27]. http://www.xinhuanet.com/politics/2019-10/31/c_1125178024.htm.
[4] 雷朝滋.发展“互联网+教育”推进教育深层次、系统性变革刻不容缓[DB/OL].[2020-01-06]. http://zgcxjy.com.cn/JiaoYoShiDian/9210.aspx.
[Abstract] Combined with rich application scenarios and cases of big data technology, MEI Hong, an academician of Chinese Academy of Science, has elaborated the main connotations, development process and the impact of big data on the information society. He has pointed out that the current application of big data is still in its infancy and needs rational understanding. If combined with artificial intelligence, intelligent application will be better realized. In the field of education, the potential transformative impact of big data on all aspects of education and teaching has also been analyzed. So it is necessary to pay attention to the deep mining of "individual data" to truly "teach students according to their aptitude" and to focus on the new paradigm of education research generated by big data and its influence on future social education service model and educational decision-making, so as to promote the improvement of the efficiency of social governance. Mei Hong believes that "knowing big data and making good use of it" will be the basic literacy and ability demand of people in the era of digital economy. To better face the age of Intelligence driven by big data, talents with leading abilities need to be cultivated. Moreover, the training of computing thinking needs to be strengthened to increase the training of software talents and do a good job in talent reserve.
[Keywords] Big Data; Educational Transformation; Public Services for Education; Educational Governance; Computational Thinking
[关键词] 大数据; 教育变革; 教育公共服务; 教育治理; 计算思维
[中图分类号] G434 [文献标志码] A
[作者简介] 沈阳(1985—),女,安徽宿州人。助理研究员,博士,主要从事智慧教育、智慧学习环境等研究。 E-mail:[email protected]。
一、大数据技术的发展及面临的挑战
访谈者:梅院士,您好!非常感谢您拨冗接受我们的采访!您是大数据领域的著名专家,先请您给读者介绍一下大数据技术的主要内涵、发展历程,以及对信息化社会带来的影响。
梅宏:数据在我们人类社会发展过程中一直扮演着非常重要的角色。文明之初,“结绳记事”是我们记录数据的一种方式;文字发明以后,“文以载道”,记录了人类发展史;到了近现代,“数据建模”成為我们认识客观世界的一种科学方法。如今,随着信息技术与通信技术的发展,特别是过去20多年互联网的快速发展和应用,人类社会迈入大数据时代,全球数据呈现爆炸式增长的趋势。按IDC(国际数据公司)的估算,全球数据总量在2030年可以达到2500ZB(1ZB=1021字节),而这一数据在2009年仅为0.8ZB。
大数据是信息技术革命与经济社会活动相互碰撞、交融的产物。所谓大数据,并非仅仅表现为数据量大,更多体现在数据的多源(元)。大数据指的是规模巨大到无法通过现有数据库工具在合理时间内获取、存储、管理、处理和整理的数据集,具有海量性、多样性、时效性及可变性等特征,需要通过可扩展、高性能的计算平台高效地存储、处理和分析。
在信息化的发展历程中,主要经历了两个高速发展的阶段,我们分别称之为:信息化1.0和信息化2.0。信息化1.0发轫于20世纪80年代,随着个人计算机进入市场,带来了以单机应用为主要特征的数字化浪潮。随后大约历经十多年的技术发展,信息化2.0初露端倪。也就是在 20世纪90年代中期,互联网的大规模商用,推动了以联网应用为主要特征的网络化浪潮。而当下,开启信息化3.0帷幕的正是大数据技术。随着数据量的积累与各行各业的交叉融合,我们已经迈入并正在迎来以数据的深度挖掘和融合应用为主要特征的智能化阶段。并且,随着5G、物联网、人工智能、云计算、虚拟现实等高新技术组合创新、赋能社会的大背景下,“人、机、物”三元融合成为必然,以“万物均需互联、一切皆可编程”为目标,数字化、网络化和智能化进程呈融合发展新态势。
大数据的发展承载了人类信息科技的进步,也深刻地改变了我们的工作和生活。AlphaGo先后击败世界围棋冠军李世石和柯洁,攻克了人类在棋类的最后一个“智力堡垒”;通过大数据技术对奥斯卡奖项的归属进行预测,准确率高达87.5%;基于购物大数据,则可以对用户信用、购物习惯等进行分析,通过精准推荐或快速信贷等给人们带来更大的便利,等等。当前,已经出现了大量成功的大数据应用实践。作为信息化进程的新阶段,大数据给我们提供了认识复杂系统的一种新手段、新思维。从信息技术发挥的作用看,如果说过去更多是作为各个行业提质增效的工具,扮演辅助者的角色,在大数据时代,信息技术将成为变革者、引领者,引领社会经济的发展。大数据的发展推动了数字经济的形成与繁荣,这是继农业经济、工业经济之后的崭新经济形态,数据是其中重要的生产要素。
访谈者:媒体上的宣传热潮之后,我们应该怎样理性认识“大数据”?大数据研究面临怎样的挑战?
梅宏:大数据逐渐成为研究和实践的热点,吸引了众多企业、风险投资和研究者的关注和进入。大数据作为战略资源的地位已成为高度共识。2012年,全球大数据产业初见雏形;2013年,对大数据的宣传达到顶峰;2014年,大数据产业结构逐渐成形,对其认识也趋于理性。如今,全球对待大数据的态度已趋客观和理智。相对而言,我国和国际上存在3~5年的时差。
然而,当前大数据的发展也存在很多短板和制约因素,需要我们审慎地加以理性认识。例如:我国的数据治理体系远未形成;隐私保护和数据共享开放之间的矛盾突出,导致数据壁垒;相应的法律法规体系尚未建立健全,大数据场景应用难以规避安全隐患、隐私风险等伦理问题。
当大数据应用超前于相应的理论和技术发展,往往缺乏坚实的理论对数据分析结果进行支撑,未必符合预期或者具备严谨性和科学性,那么,我们对这些结论的使用就需保持谨慎态度。前面我提到,大数据基础理论的研究仍处于萌芽期,尽管我们对大数据定义已达成初步共识,但在数据驱动与规则驱动的对立统一、关联性与因果性的辩证关系、“全数据”的时空相对性、兼顾分析模型的准确性与可解释性等诸多深层次、本质性问题上仍存在争议。
前面,我举例说明了数据体量和规模在几何级高速增长,但囿于信息技术在未来一段时期内将保持稳步渐进的发展态势,对数据的处理能力提升速度就显得相对滞后,所以说,大数据现象将会长期存在。反过来,大数据现象也将倒逼技术变革,加速信息技术体系的重构。例如,对计算机体系结构来说,带来了“以数据为中心”的宏观走向和“存算一体”的微观走向等。同样,大数据现象延展到其他各个领域,对信息技术体系的变革都可能是一场颠覆式的生态重构。因此,大数据研究的挑战是方方面面的,需要建立在深度的多学科交叉和“产—学—研”高度融合基础之上。 访谈者:为什么您说当前的大数据应用尚处于初级阶段?如何更好地推动基于大数据的智能化应用?
梅宏:大数据应用可以分为三个层次:第一层是描述性应用,从数据中抽取知识和信息,并刻画事物的发展态势;第二层是预测性应用,通过对事物当前的现状进行描述,分析关联关系、发展模式,预测其未来的发展趋势;第三层是指导性应用,对不同的预测结果进行权衡,为最终决策的优化与指导提供依据。
从总体情况来看,当前的大数据应用仍存在如下问题:首先,实践中的应用大多属于描述性和预测性,而指导性应用这类深层次的应用偏少;其次,目前的数据源仍旧较为单一,彼此之间相互关联的多源多模态数据较少;另外,模型导向的应用较多,面向实际需求构建模型的应用较少。这些问题表明,虽然我们在大数据研究和实践方面取得了许多可喜的进展,但是仍旧具有较大的提升空间,大数据应用仍然处于初级阶段。
大数据的智能化应用本质上是数据驱动的智能,是人工智能方法和技术在“大数据”上的应用呈现,进一步的发展需要大数据基础理论和方法上的新突破,也需要人工智能方法和技术的新进展。谈到人工智能,对大众来说,由于受到媒体、影视的渲染,人工智能充满着科幻色彩。实际上,人工智能是一门多学科交叉融合的科学,当前人工智能所取得的成功离不开大数据的应用。早期的人工智能走的“规则驱动”路径,即通过构建事实库和规则库,借助逻辑推理来实现智能,然而,这个途径并未能达成其最初宣称的目标。当前的人工智能可归为“数据驱动”的路径,基于海量的数据集,通过统计分析或机器学习等各类算法从数据中分析、挖掘现象和规律,从而产生了很多具有实用价值的应用,带来了人工智能的新一轮热潮。
当前数据驱动的智能也存在不少问题,具体体现为三“大”:大模型,动辄涉及数百万、甚至数十亿的模型参数;大系统:以算力拼智能;大数据:以数据换智能。因此,其应用效果也就显得低效、不通用、不透明、鲁棒性差。数据和智能是体和用的关系,数据为体、智能为用,打一个不是那么严格准确的比喻,就像燃料与火焰的关系,燃料越多,火焰越旺,燃料越纯,火焰越亮。
从软件实现的视角来考察,大数据的智能化应用可以分为三个层次。第一层次是早期人工智能的做法,即软件系统+知识库,这里知识库事先由人构建好,其完善扩充也需人工完成;第二个层次是当前数据驱动的智能途径,即软件系统+自演化的知识库,知识库的自演化需要“学习”能力,这仍是当前努力的方向;第三个层次应该是自演化的软件系统+自演化的知识库,希望软件系统能够自我完善,甚至自动构建,当然,我们距离这个目标还有很长的路要走,目前学术界围绕软件自动化已经开始了一些探索。
二、大数据时代的教育
访谈者:大数据在教育中的应用场景可能有哪些?大数据技术的应用会对我国教育事业的发展产生怎样的影响?
梅宏:党的《十九大报告》明确提出:“建設教育强国是中华民族伟大复兴的基础工程,必须把教育事业放在优先位置,深化教育改革,加快教育现代化,办好人民满意的教育。”[1]尤其是,“中国教育现代化2035”规划的我国教育战略,是赶超世界先进教育水平的重要战略部署,为了加快教育现代化、建设教育强国的进程,需要充分运用新理念、新模式、新技术激发教育创新能力,培养适应时代发展的创新型人才。大数据作为当前新一代信息技术发展的重要领域,也应成为新一轮教育创新和教育重大变革的重要推手,成为实现教育现代化宏伟目标的重要动力与支撑。
谈到大数据在教育领域的应用场景,由于我不是研究教育的专家,也未曾从事过教育信息化方面的工作,因此,相比专业从事相关研究和实践的学者,可能难以细化和具体化,只能从一个普通教育工作者的角度,谈一些认识。前面提到,大数据给我们提供了认识复杂系统的一种新手段、新思维。我想,教育本身就是一个极其复杂的系统,无论是教育的过程,还是参与其中的个体或组织。理论上,透过教育的信息化(数字化、网络化、智能化)及其产生的教育大数据,我们可以形成相对应的洞察,从而更好地把握其本质和规律。基于这个观察,大数据在教育领域的应用,将会贯通于教学模式、手段、环境、管理、评测等多个环节。大数据技术的应用,将深入推动教育教学、教育评价、教育服务、教育治理、教育决策等全方位、深层次的变革转型。
从微观层面,大数据的应用可能会对未来的教学模式、教学评价等环节产生影响,例如:
在教学过程中,利用信息技术手段记录下教与学过程中的详细行为数据,可以更加精细地刻画和分析教师与学生的实时状态,并诊断与预测师生在教与学过程中存在的问题,进而依据不同个体的自身状态,实时调整教学内容与进度,实施精准的个性化教学。
在教学评价方面,通过跟踪学生学习的过程、记录学生全方位的行为数据,从而建立一个更加全面的教学评价体系,使教学评价不再仅仅注重学生的学习成绩,而更加注重对学生综合能力与成长状态的评价,从而促使评价更加依赖于客观数据,评价维度更加多元和全面,也更加注重对学生学习过程的考察。
大数据的深入应用也催生了很多新型的教学手段。如,利用基于大数据训练的智能引擎,实现机器辅助的自我训练与学习,已逐渐成为一种有效的教学方式。在外语学习过程中,帮助学习者及时识别并纠正发音错误;在写作训练中,帮助学习者及时发现并纠正书写中的错误等。这些新型教学手段的出现,使得“人与机器”的互动学习成为“人与人”传统教学方式的重要补充。此外,MOOC、SPOC、个性化学习、学习路径推荐等新理念、新方法也不断促进教育教学改革,大数据技术在教育改革和人才培养中发挥的作用将会越来越重要。
从宏观层面,大数据的应用也可能会对未来社会的教育服务模式、教育决策等方面产生影响。例如:
随着时代的进步,人们学习的发生场景也越来越多,并呈现出碎片化的趋势,利用大数据可以对学习者在不同场景中的行为模式和学习规律进行分析,从而更精准地发现隐藏在数据中的教育现象或规律,进而可以为学习者提供更为客观和精准的个性化教育服务,促使教育服务转向“基于场景的精准化、个性化服务模式”。 在教育决策方面,在大数据的支持下,可以对每个参与教育的个体进行伴随式数据采集,在此基础上对来源于不同地域、不同时段、不同场景的多元教育数据进行分析,能够使决策者全方位充分了解教育现状,从而为教育主管部门与监管机构提供制定政策所需的决策依据。
科学研究经历了实验归纳、模型推演、仿真模拟三类范式,大数据催生了科学研究的“第四范式”,即数据密集型研究范式。教育研究范式也会因大数据的应用而发生重要变化,催生“大数据驱动的教育研究范式”。传统的教育研究范式偏重于基于经验的定性研究和基于局部抽样的定量研究,难以全面准确地发现隐藏在数据中的现象和规律,而教育大数据中蕴含着大量有意义的教育规律和教育模式,关键在于以合适的方法、技术和成本对其进行深层次挖掘、分析和应用。
教育大数据为教育变革提供了新的思路和技术支撑,在全方位推动着教育变革的同时,也将催生适应时代发展的新型教育治理体系。充分利用大数据的思维、方法对海量教育数据进行分析应用,为教学活动、教学评价、教育服务、教育决策等教育事务,构建一个以大数据为基础的现代化教育治理体系。同时,我国也高度重视教育信息化的基础设施建设,国务院发布的《促进大数据发展行动纲要》中明确提出完善教育管理公共服务平台,推动教育基础数据的伴随式收集和全国互通共享;推动形成覆盖全国、协同服务、全网互通的教育资源云服务体系等重要举措[2]。
访谈者:在充分重视和发展大数据技术,运用大数据的同时,是否也有必要关注教育参与者的“个体数据”?如何处理教育大数据和“个体数据”的关系?
梅宏:站在整个教育领域的高度,教育大数据往往是反映教育服务模式、总体需求等方面的规律,然而,“个体数据”作为教育大数据的不可或缺的组成部分,反映着学习者的个体行为模式、心理情绪状态和感知/认知方式等,结合个体数据对教学活动的需求、内容、模式进行深层次细分设计,能够使教学内容更加贴近个体需求,使教学过程更加个性化。
在宏观层面上,通过教育大数据的描述性、预测性、指导性分析,发现群体行为规律和总体需求,能够为教育决策层提供客观、科学的依据;在中观层面上,利用教育大数据得到的群体规律和总体需求,结合师生个体的数据特性,分群体、分层级地监控、管理和优化教学过程,能够为教育管理层提供科学、有针对性的教学决策和教学设计;在微观层面上,基于教育大数据的数据模型,融合学习者的“个体数据”的深层次挖掘,为每位学习者构建面向个体的学习诊断、预测、干预等教育模型,可以提供个性化的学习支持服务,真正做到“因材施教”。
教育家苏格拉底曾经说过:“教育的本质是唤醒,是开发你的内心。”教育的初心是培养人和发展人,最终是落实到学习者的个体发展上。在这个意义上,社会中每个教育参与者的“个体数据”,包括行为模式、生活习惯、学习规律等,应该得到足够的关注。
访谈者:智慧城市建设离不开大数据技术,请您对智慧城市建设中,教育公共服务数据治理方面给出一些建议,好吗?
梅宏:教育公共服务是智慧城市建设的重要内容,如何构建一个适应未来城市发展的教育公共服务体系是未来城市建设迫切需要解决的问题。智慧城市具有数据全面感知与记录、资源体系协同共享、信息智能处理等特征,使得人们的生活越来越数字化。可以说,“生活数字化” 是智慧城市的重要特点,数据产生于人类社会的各种活动中,从这个意义上说,智慧城市是以“大数据”为核心的新型城市,智慧城市的教育公共服务也旨在打造以“大数据”为核心的新型教育公共服务体系。
通过大数据与教育的深度融合,将大数据深度融入日常的教学活动、教育评价、教育管理与决策等关键环节,推进教育公共服务在内容、模式、形态、质量监控等方面的现代化治理进程:服务内容上,构建虚实融合的多维度、多粒度教育服务内容供给体系;服务模式上,构建面向不同场景与需求的个性化教育服务模式;服务形态上,构建大规模社会化协同的公共教育服务形态;服务质量监控上,构建基于大数据分析的实时服务监测与质量分析服务。这种新型的教育公共服务治理模式,将改变传统的僵化封闭式的教育公共资源与服务治理方式,实现传统的教育公共服务模式与基于大数据的教育公共服务模式的互补,进而能够加快推进我国教育治理现代化的进程。
党的十九届四中全会对坚持和完善中国特色社会主义制度、推进国家治理体系和治理能力现代化进行了新的战略规划,即到我们党成立一百周年时,在各方面制度更加成熟、更加定型上取得明显成效;到2035年,各方面制度更加完善,基本实现国家治理体系和治理能力现代化[3]。其中,社会治理体系的建设无疑是重要的内容,提升社会治理效能,需要分层次、多维度推进,更需要大数据的助力。智慧城市建设作为我国城市建设的新阶段,是基于城市大数据的社会治理体系的重要承载。
三、加强计算思维能力培养,加大软件人才
队伍培养,为大数据时代做好人才储备
访谈者:大数据驱动的智能时代正在来临,我们的人才储备应该作哪些适應性调整呢?
梅宏:在信息化的新阶段,在数字经济的时代,我们每一个人都需要“懂得大数据,用好大数据”,可以说,这将是数字经济时代对人的基本素养和能力需求。为了更好地面对大数据驱动的智能时代,重点是要培养具有引领能力的人才[4]。
随着大数据对人类社会和现实世界的渗透力越来越强,影响面越来越广,受其辐射和影响的人群也越来越多,并随之产生了一系列在伦理、可信、隐私保护、安全等方面的新问题,大数据与人类社会间的关系变得更为紧密,大数据教育需要普及化和全民化。
随着计算平台不断向物理世界和人类社会快速延伸,大数据作为连接物理系统和社会系统的桥梁作用日趋重要,大数据正逐渐成为诸多行业和领域解决其特定问题的核心手段和必不可少的工具。这些行业、领域的专业人才需要掌握大数据分析的基础知识和核心能力,学会运用相关工具来解决特定领域的问题;同时,大数据专业人才也需要向特定领域扩展和渗透。 當前,我国已有近500所高校开设了数据科学与大数据技术本科专业,开展人才培养和储备的相关工作。
访谈者:什么是计算思维?您认为针对不同人群的计算思维培养应注意哪些问题?
梅宏:计算思维是信息社会中现代人的基本素养,也是人类诸多认知能力的核心要素之一。从内涵上看,计算思维是运用计算机科学的基础概念和逻辑去理解问题、分析问题和解决问题的思维方式。计算思维能力绝不仅仅是编程技能,也不纯粹是掌握某些程序设计语言,它还包括创造软件来解决问题的能力,以及由此所需的其他创新思维能力。现阶段软件已经渗透到自然科学、工程技术、社会人文等方方面面,计算思维与其他认知能力相互作用,相互影响,不可分离。
计算思维培养的受众对象涉及面广、差异性大,来自各行各业,知识背景各不相同,认知能力千差万别,且需面对从儿童期到少年期、青年期、中年期甚至到老年期各个不同时期的人群。针对不同的受众对象,他们在计算思维等认知能力的成长方面具有不同的规律性,因此计算思维的培养模式不能单一化,教育方法不能统一化。对于儿童和少年,通过游戏编程、可视化和实物编程等方式,有利于推动以计算思维为核心的认知能力的逐步形成和深化,这需要师范类院校的引领,需要加强K-12阶段的计算思维课程的开发与设计;对于青年,通过创新思维与软件核心认知能力的紧密融合,能够有效推动其认知能力的提升,这是高等教育改革中需要关注的问题;对于成年人,通过软件创意创作来沉淀和累积个人智慧,是发挥其个人特长的有效方法,这可能成为研究生教育、职业教育的新命题;而对于老年人,无处不在的泛在学习、终身学习理念正深入人心,在未来编程很可能成为老年人的另一个重要的兴趣方向。与此同时,随着信息技术的发展,教育的方式和方法也在不断地改变。相应的,计算思维的培养也需要寻求适应不同年龄段、不同行业领域、不同认知水平的学习对象的教育理念和方法。
访谈者:您提到这个时代是一个“软件定义的时代”,请您谈一谈我国应怎样实施软件人才的培养战略?
梅宏:我们正在进入一个新的时代,人们从基础设施、计算模式、信息资源、信息应用等不同的视角将其称为“互联网+时代”“云计算时代”“大数据时代”“智能化时代”等,然而,从一个软件研究者的视角,我理解,在这些称谓的后面,一定离不开软件!软件和芯片是构建信息化社会的基本元素。软件是信息基础设施的重要组成部分,是计算模式的实现载体,是信息资源的管理者和处理者,也是信息应用的呈现形式,从这个意义上讲,软件是这个时代的使能技术,这将是一个“软件定义的时代”。
随着软件学科边界的不断拓展,软件内涵持续演化,它对人类社会的影响面日益扩大,相应的,软件学科教育的重要性也日益凸显。如何加强软件学科教育,提高人才培养的质量和水平,成为全社会关注的话题。
过去两年来,我和国内的软件界同行承担了中国科学院和国家自然科学基金委联合资助的软件学科发展战略研究项目,在回顾软件学科发展历程,展望软件学科未来挑战和发展趋势的同时,也涉及了未来软件人才培养的议题。我们认为,应该注重开展以下方面的工作:
推行以“计算思维+创新思维”为核心的普及性教育,包括积极推行与软件学科核心认知能力的成长模型和规律相对应的知识体系,积极推行以计算思维为核心、融合创新思维的系统化认知能力培养方法,积极推行适应不同认知水平且贯穿终生的软件学科普及教育方法。
推行以“多学科交叉融合知识体系+系统能力和解决复杂工程问题能力培养”为核心的专业教育,包括建立面向多学科交叉融合的软件学科专业教育的知识体系,建立软件学科专业教育核心能力的培养方法。
推行以“专业学科知识+软件学科知识”为基础,实现复合型、创新型和跨界人才培养的其他学科专业教育,包括建立基于“专业学科知识+软件学科知识”的其他学科专业教育知识体系,建立具有软件学科知识和能力的复合型、创新型和跨界专业人才培养方法。
开展以“探究成才规律+寻求理念创新+开发支撑软件”为核心的教育方法改革,探索软件学科人才培养模型及规律,研究软件学科资源在人才培养中的应用方法,推进群体化学习和大规模在线开放实践(MOOP),研发软件学科教育的支撑软件。
[参考文献]
[1] 习近平.决胜全面建成小康社会 夺取新时代中国特色社会主义伟大胜利——在中国共产党第十九次全国代表大会上的报告[DB/OL].[2017-10-27]. http://www.xinhuanet.com/2017-10/27/c_1121867529.htm.
[2] 国务院.关于印发《促进大数据发展行动纲要》的通知[DB/OL]. [2015-09-05]. http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[3] 新华网.中国共产党第十九届中央委员会第四次全体会议公报[EB/OL]. (2019-10-31)[2020-05-27]. http://www.xinhuanet.com/politics/2019-10/31/c_1125178024.htm.
[4] 雷朝滋.发展“互联网+教育”推进教育深层次、系统性变革刻不容缓[DB/OL].[2020-01-06]. http://zgcxjy.com.cn/JiaoYoShiDian/9210.aspx.
[Abstract] Combined with rich application scenarios and cases of big data technology, MEI Hong, an academician of Chinese Academy of Science, has elaborated the main connotations, development process and the impact of big data on the information society. He has pointed out that the current application of big data is still in its infancy and needs rational understanding. If combined with artificial intelligence, intelligent application will be better realized. In the field of education, the potential transformative impact of big data on all aspects of education and teaching has also been analyzed. So it is necessary to pay attention to the deep mining of "individual data" to truly "teach students according to their aptitude" and to focus on the new paradigm of education research generated by big data and its influence on future social education service model and educational decision-making, so as to promote the improvement of the efficiency of social governance. Mei Hong believes that "knowing big data and making good use of it" will be the basic literacy and ability demand of people in the era of digital economy. To better face the age of Intelligence driven by big data, talents with leading abilities need to be cultivated. Moreover, the training of computing thinking needs to be strengthened to increase the training of software talents and do a good job in talent reserve.
[Keywords] Big Data; Educational Transformation; Public Services for Education; Educational Governance; Computational Thinking