论文部分内容阅读
编者按:克里斯汀·迪艾特·舒安(Christian Dieter Schunn)教授是匹兹堡大学学习与发展研究中心实验室主任,高级科学家,美国、德国、瑞士国家科学基金会(NationalScience Foundation)评委,国际教育设计与发展协会前主席,美国教育心理学、认知科学、科学技术心理学、STEM国际教育、认知系统研究期刊编委。
舒安教授主修认知心理学,在学习与发展研究中心的跨学科尖端技术领域展开长达二十年的计算机辅助智能学习理论和实证研究,自1998年开始撰书立说,据Google Scholar不完全统计,至少有十篇文章平均引用次数200次以上,是认知科学跨学科发展的开拓者、先行者,杰出的国际知名中青年高级科学家。舒安教授主要致力于研发计算机辅助写作互评系统(SWoRD)和STEM教育学习工具。其开发的SWoRD已在美国、加拿大、澳大利亚、南韩、新加坡、爱沙尼亚等国家的上千门学术英语写作教学中使用,为学科英语写作质量和数量提高起到了不可估量的作用。SWoRD积累的后台数据为人工智能科学中的自然语言处理、认知心理学、写作科学的研究提供了充分的实证研究基础。
在此次访谈中,舒安教授分享了舒安实验室研发的SWoRD智能写作互评系统的建设全过程,涵盖计算机辅助写作互评系统的建设起因与价值、国际化应用与发展、系统竞争优势以及基于SWoRD系统的跨学科研究最新动态,从而给我国引进或建设计算机辅助学科写作教学和研究系统提供重要启示。
关键词:SWoRD写作互评系统;国际化应用;系统优势与劣势;跨学科后台研究
中图分类号:G434 文献标识码:A
在世界各国,学科写作是高校本科生和研究生的必修内容。指导教师经常要求学生就某一话题和相关文章进行阅读和写作,从而培养学生的专业素养、思辨能力和写作能力。可结果往往让人沮丧,学生普遍匮乏对所读文章的分析和综合能力,很难生成自己的观点和论证。
像任何技能发展一样,学科写作技能提高需要不断实践和评改,可写作点评永远是师资资源紧张的教学环节。庞大的工作量导致教师只能给每份作文提供有限的点评,并且不要求一文多稿。面对这一棘手的问题,美国、加拿大等发达国家很多高校筹建计算机辅助写作平台,引入同学互评良性机制,从而广泛提升各个学科英语写作的数量和质量。美国匹兹堡大学学习与发展研究中心舒安教授研发的SWoRD写作互评系统就是在这样的历史背景下应运而生。
访谈者:您开始筹建学科写作同学互评计算机辅助系统(SWoRD)是在2002年。十年后,全世界很多国家如美国、加拿大、韩国、新加坡、爱沙尼亚等已有一千多门课程使用SWoRD进行学术英语写作和互评学习,展示了这一辅助系统的市场需求和广泛应用性,以及其里程碑式的发展进程。我很好奇,究竟是什么动因激发您致力于开发SWoRD系统,并十年如一日立足发展壮大SWoRD写作互评系统?
舒安:其实开发写作互评系统的初衷源于我个人的教学需求。我过去一直从事大课教学,学生规模大都在200人以上。虽然深谙给学生布置写作任务有利于促进对知识和技能的综合掌握,但限于学生规模过于庞大,不能实现布置任务和提供反馈,这曾经让我经常愧疚不安。
一个偶然的机会,我听了一个让人灵感迸发的讲座,内容是关于怎样培训对飞行员的评估。听过之后,以往制约我尝试写作同学互评系统建设的顾虑消除了,我逐渐开始形成怎样让同学互评在课堂上真正行之有效的思路,并在大量研究写作评改系统建设和同学互评实证研究的基础上,筹划撰写系统建设项目申请书,从匹兹堡大学申请了一小笔项目资助,建设了SWoRD系统初始版。初始版系统功能比较简单,我原本可以就此结项,但我最终认定这将是一个很有趣的研究领域,如果能升级此系统,并利用SWoRD系统把教学、科研和应用结合起来,SWoRD系统前景会更好。
访谈者:学科写作和写作评改确实是各国高校都日益重视的技能。在写作教学资源紧张的情况下,同学互评起到了填补反馈空白或补充教师反馈的作用。但同学互评在研究和实践领域一直是褒贬俱存的写作教学策略。纳入计算机辅助平台增加了同学互评的复杂性。您怎么看待以SWoRD为代表的同学互评系统的价值和意义?
舒安:写作教学资源紧张是通病,同学互评和计算机技术结合是目前比较好的解决办法。计算机技术可以促使学生参与到一个更为有效的写作学习进程,提供给学生直接的反馈,并可以通过计算语言学的方法识别写作内容的各种问题,譬如论文的论证结构。
用同学互评来提高写作能力,会帮助学生聚焦写作的沟通和修辞功能。很多研究显示,作为写作和评改新手,学生读者往往对论文内容并不知情,学生作者收到学生读者的反馈,一般都会有个人写作策略失当的体会。同学互评还可以帮助学生树立正确的写作观。和直觉相背离的研究结果显示,提供反馈的能力和学生写作能力并不呈现相关性,也就是说,写作能力偏低的作者能给写作能力偏高的读者提供有效点评;同时提供点评的过程对点评提供者个人的写作能力亦有提高,尤其当学生提供建设性点评,并把这一努力运用到写作进程中。在学习理论研究中,同学互评和很多主动学习理论不谋而合,包括合作或协作学习、反馈提供式学习、反复实践式学习以及相关专业技能任务式学习等。
访谈者:正如您所预见的一样,您和您的团队,基于SWoRD展开系列的研究,且研究成果丰富。据我所知,至少十余篇论文发表在计算机与教育、教育心理学、指导科学、设计研究、技术、教学与教育、写作交流、写作研究等专业期刊上。您能说说基于SWoRD的代表性研究成果吗?
舒安:基于SWoRD的研究一方面立足于对计算机辅助教学设计的可行性、可靠性和效度进行长期的实验跟踪研究,但另一方面不局限于写作研究,还服务于认知、人工智能、心理学、教育学等交叉学科的研究主题。研究共性是几乎每一个学期都有基于此系统进行的教学、认知等实验。基于SWoRD的信度、效度和可靠性的研究从2006年开始有系列研究成果。目前,主要研究结论有:同伴从为他人提供的有建设性评价中学会更有效的写作;基于多人次同伴互评的文本修改,其效果较单人次专家评改效果可能更好;来自多位同伴互评的成绩比单一教师生成的成绩更有效;一般来讲,写作水平高低不同的学习者都会从反馈中受益;学生们利用计算机辅助图表分析文章脉络能产生更有效的文本。近期还会有引入评改工具、论文结构自动分析工具等结合同学互评系统研究的成果陆续发表。 访谈者:SWoRD功能齐全、界面良好,使其迅速成为商业化运作的教育产品“Peerceptiv”。您认为SWoRD系统商业化推广成功体现了哪些有指导意义的学习理论?实现了哪些教育设计理念或教育技术更新的需求?
舒安:在建设系统的过程中,我们吸纳了来自各个学科的学习理论和研究成果。首先,从写作学科的Flower和Hayes研究成果中,我们吸取了写作认知进程模式理论中的重要观点。该理论认为,写作进程的最佳理解方式是写作者导演或组织了一整套不同的思维进程。这些思维进程有级层性,彼此镶嵌交叉,为写作目标服务。作者主要以两种方式生成目标,一种是生成高级目标和辅助性分目标,从而体现作者的主要目的,然而在这一过程中,也可能以另外一种方式,即改变主要目标生成新目标。这些重要观点对同学互评系统中的教学干预如学习目标明示、自我反思表述等都起到了理论导向的作用。
从Vygotsky的教育发展理论来看,知识和技能习得的最近发展区出现在专家与新手、新手与新手的互动过程中。同学互评系统恰恰提供了这样的最近发展区。SWoRD不仅给予学生个体充分交流的机会,还在更大程度上促进分析和评价能力的生成,并通过内容和分数的评价及回评将最近发展区的发展模式进一步机制化。SWoRD的研究结果也佐证了最近发展区理论的可行性和有效性。
从Boh Siegler的策略发展理论以及各种各样的自我规约学习理论研究中,可以获得两个教学启示,学习者在评价解决办法方面的能力增强后能够产出更妥帖的解决方法;学习者必须规约自己的学习进程,而同学互评恰巧为培养这种规约性学习过程提供多种方式。
此外,学习科学是跨学科领域。我们的研究团队中有合理的跨学科人力资源梯队,譬如有心理学专家,计算机科学专家,也要有教育教学领域专家。在彼此充分沟通和合作的基础上,服务于学生共同体的教育设计才能真正满足教师学生的需要。以SWoRD为代表的计算机辅助写作互评系统就是在这样一个团队里,在互联网时代成为为写作学习共同体提供的强有力的教育设施。
访谈者:据我所知,全美至少还有两家商业化的同学互评系统,一个是Turnitin公司附加服务中的Peer Mark系统,一个是加利福尼亚大学提供的人T辅助同学互评系统。与这两大商业化系统相比,SWoRD写作互评系统的优势和劣势是什么?
舒安:SWoRD的独特之处在于采用信用压力等机制促使学生认真对待作文点评与评分。反复实验证明,当学生认为自己的点评和评分不会产生任何后果时,同学互评是起不到很大作用的。在此种情况下,学生通常给出最高的评分和最常见的简短好评(例如“写的不错”)。因此,Turnitin公司附加服务中的Peer Mark系统要求写作教师浏览所有评论后给分,倘若需要给分的话。实际上这份工作量远比单纯给学生批改作文要大要难,并不是很好的解决办法。
加利福尼亚大学的Calihrated Peer Review(CPR)系统给学生施加怎样评改作文的培训,并且培训质量很高,但并未对学生互评过程进行监控和影响。因此使用CPR系统的教师对互评结果喜忧参半。有个别新衍生出来的系统也尝试使用SWoRD的方法,尽管在有效性上还有很长的路要走,譬如MohiusSLIP,有比较复杂和混乱的工作界面,并且只支持作文整体评价。
诚然,SWoRD与另外两个领军系统相比在规模上小些,年纪轻些。加利福尼亚大学的CalihratedPeer Review(CPR)系统开发最早,在同学互评系统应用中知名度和使用规模上首屈一指,在作业设计上能够根据科学课中的很多学科建设共通的写作任务,从而起到帮助学生深入巩固本学科知识和技能的作用。Turnitin公司的知名度和广泛应用性主要体现在其对论文是否抄袭的评估和检测上,同学互评是其后附加的一个设计功能,并不在其公司规划中占据重要的发展角色。
访谈者:SWoRD已经应用于人文科学、社会科学、自然科学上千种课程的写作教学中。系统为有写作元素的课程融合更丰富的写作学习任务,也为需要添加写作要素但限于反馈局限问题的课程实现课程作业写作化,从而在不增加教师批改任务的前提下,帮助学生掌握学科的知识和技能。这本身已是壮举。您认为系统建设还有何其他重要教学效果?除了已经证实的教学效果,SWoRD写作互评系统旨在最大化教学效果的下一步努力是什么?
舒安:显而易见,SWoRD最明显的效果在于能给予学生很多写作练习的机会。另一个优势在于提供给学生非常难得的契机:从给予他人反馈中学习。我们的系列研究显示,给予他人反馈有至关重要的学习收获,有时比练习写作的收获更大。因为给予反馈集中体现了评者对作品的阅读、分析、综合、以及评判能力。在最大化教学效果方面,我们目前正在研究何种类型的写作任务,何样的同学互评评分标准能够更恰当地提供互评机会。
访谈者:与此同时,SWoRD也应用于很多高中和初中课程教学中。有研究显示,系统对学生写作质量和数量的提高起到了至关重要的作用。您认为在K-12教学中更大规模使用SWoRD面临什么样的机遇和挑战?
舒安:在高中和初中课程中使用SWoRD,我们要克服两个主要问题。第一个是技术层面的。大学生有很多机会使用计算机和网络,但高中生机会少很多。学校的计算机网络教室由众多班级共享,且因为年龄限制,对于很多校外网站禁止登录(因此像SWoRD写作互评教育资源网页也经常被设在禁登录范围内)。好在几乎所有的学生在家都享有个人电脑,因此中学的同学互评大都是在家里完成,学校仅偶尔在课上使用。第二个问题是教学层面的。在很多学校,教师已经习惯于避免布置写作作业,在教学中对何种写作任务能够促进教学效果并不了解。因此,我们正在集合来白优秀中学中的实例,教育学科和学术写作对写作内容、过程和方法的理念设计,筹建写作任务资源库和同学互评评价标准资源库,从而便于在宏观和微观上服务中学学科写作教学。 访谈者:计算机辅助写作同学互评涉及认知层面和合作层面的复杂性。SWoRD提供哪些具体措施帮助学生作者培训和提高评改技能?
舒安:SWoRD提供评改的视频培训,给出评改质量不一的具体实例帮助学生理解。系统还提供作者回评的工作界面,从而对评改质量进行反馈,包括详细解释为什么认为评改有帮助与否。
同时,SWoRD的人工智能功能会自动处理评改意见,从而给评改者关于评改质量的及时反馈。然而,这种反馈仍然是在不断进行的研究主题,因为我们对何种反馈能够起到最好的效果仍然没有定论。
访谈者:据我所知,两个最大的Mooc组织选用不同的方法评价学生提交的作业并打分。EdX、马萨诸塞和哈佛的非营利组织在2013年宣布他们会使用计算机辅助自动评分系统评估写作作业。Coursera、斯坦福大学建设的MOOC.系统对自动评分应用持怀疑态度,认为采用某种形式的人T为基础的同学互评系统来给写作打分和点评效果更好。
作为计算机辅助写作评价领域的专家,您对东西海岸的MOOC系统教育选择怎么看?就您所知,在这一领域有什么最新的情况吗?您可以谈谈自动评分系统和同学互评系统各白的潜力和局限吗?MOOC课程有使用SWoRD的可能性吗?
舒安:自动评分系统能为各类写作作业提供可靠有效的评分。现有很多研究显示,自动评分系统甚至比专家评分还要可靠。广泛使用自动评分的主要障碍其实是社会学层面的:普通人并不相信自动评分。这种障碍会随着时间推移逐渐改善。同样的恐惧见于各种自动化发展之初(譬如无人驾驶机器人车)。
然而,自动评分系统剥夺了作者彼此提供反馈的学习机会。此外,自动评分系统并不擅长提供实用的反馈意见。因此,我认为使用自动评分系统作为总结性和终结性评价是比较可取的,但对于使用自动评分系统作为学习过程中的形成性反馈并不可取。
一般的互评系统能为没有同学互评经验的学习者提供基础培训,然而匮乏信度保障机制意味着同学互评的质量依然停滞不前。SWoRD在这方面有明显的辅助优势。然而我认为在真正的MOOC大规模网上免费公开课程中,太多的学习者丝毫不在意真正的写作成绩如何。如果以后要求学习者支付少量费用,那么运用SWoRD会恰到好处。我认为在很多大学里,电子学习、远程学习会大幅度增长,SWoRD写作互评系统也很适合。
换句话说,大规模网上课程(Massive OnlineCourse,MOC)正好适用SWoRD,而大规模网上公开免费课程(比MOC多一个O=Open and Free)就不会那么奏效。
访谈者:基于SWoRD的研究涉及很多跨学科专业知识和技能,譬如计算机科学、写作教学法。您作为系统开发的始创人和负责人,是怎样把握这一系统所需要的计算机技术和教学理念设计呢?
舒安:在某种程度上来说,我的本科阶段有很多计算机科学学习背景,而卡耐基梅隆大学的博士学习包括大量的编程和人工智能,这些都恰好在SWoRD建设中加以运用。关于写作教学法,可以说,自从建设SWoRD伊始,我一直在和写作教学专家合作。譬如,我和奥斯丁得克萨斯大学研究修辞的Davida Charney教授,以及现在匹兹堡大学从事英语教育的Amanda Codley教授就写作都有密切合作。
访谈者:您的主要学术背景是认知心理学,为什么认知心理学研究和写作互评密切相关?换句话说,基于写作互评数据的认知心理学研究,开展什么研究主题呢?
舒安:认知心理学对研究专业知识发展的机制情有独钟。可关于专业知识发展的数据很少能从不良定义的问题解决中获取。写作恰是解决不良定义问题的经典例子。计算机辅助同学互评能够创造很多数据收集的机会,从而在庞大学生群体的研究样本中研究专业发展进程。
访谈者:SWoRD展示了数据科学和教育科学的经典融合,这也是未来研究的基本趋势。基于SWoRD有很多跨学科研究需求,那么跨学科研究有什么相同或不同的主线吗?
舒安:目前,我们正在研究跨学科写作作业如何共享的规律。每门课程都有其独特的教学目标和学生群体,这意味着数量小、质量高的作业并不能起到普遍和广泛的作用。如果每个指导教师都要开发与众不同的写作任务,SWoRD的使用效率会很低。因此我们着重研究跨学科写作任务相通的作业模式,并允许指导教师在已有其他老师布置的写作作业的基础上,设计新的写作作业,以便更好权衡内容适切度和写作效果。
访谈者:以SWoRD为代表的计算机辅助写作互评系统为例,您能谈谈这一领域目前的研究进展和研究方向吗?您在未来研究中,认为什么样的研究局面可算是下一个里程碑式的进展?
舒安:SWoRD所提供的互评基础支持可以有很强大的教学作用。但学会学科写作或者说学科论文写作对学生来说是一个更大的挑战。面对这一挑战,学生可以从附加的各种计算机技术支持中得到帮助。我们一直致力于开发SWoRD的多种升级功能,从而生成更值得推广的教学效果。譬如,同学互评作用的实现依赖于学生在确定写作的思考框架,并形成自己的初稿中做出大量工作。那么在写作教学的写前阶段,SWoRD能起到什么辅助作用呢?目前,我们正在尝试研究使用画论证图表的方法在写前阶段帮助学生梳理思路,且论证图表同样需要同学互评进行点评。另一主要相关项目涉及研究同学互评所引发的写作变化,即修改过程研究。譬如,我们帮助学生开发了修改计划实施工具,根据学生生成的点评生成修改界面。我们认为,促使学生对他们所得到的反馈明确态度和做法,有利于引导他们关注真正的修改过程。与此同时,我们试图基于实验数据生成计算方法,从而自动分析修改的本质,即修改仅是句法层面的,还是改变了论点和论证的质量。
访谈者:计算机辅助同学互评系统越来越成为很多其他国际教育机构争相开发的学习系统。在建设这样一个计算机辅助同学互评系统的过程中,您认为会遇到哪些主要的挑战?作为这一领域的权威专家,您能说说经验和建议吗?
舒安:任何计算机系统建设是团队充分合作的产物。除了有明确合理的系统建设目标和设计做指导,计算机信息技术以及教育技术的专业人才的配备和配合是必备条件。在此基础上,系统建设的软硬件定时维修维护需要大量人力物力的后期投入。系统建设的最终目的是应用,在应用于写作教学的过程中还会遇到很多挑战。尤其是当写作作为学习任务加入到一个以往没有或少有这一元素的教学情境时,面临教学者和学生的首要的问题是哪种写作任务适合学习者,这需要对具体学习情境进行反复调查和研究。SWoRD可以提供对任何写作任务和评价标准是否运行良好的诊断性统计算法,这使我们的研究工作容易有进展。
访谈者:SWoRD已经用于全世界众多国家1000多门课程。中国一贯把学术英语写作看作大学生专业素养培养的重要实现方式和大学教师学术水平的衡量尺度。您考虑过将SWoRD推向中国吗?
舒安:我认为中国确实有使用写作互评系统的潜力。二语习得研究显示,母语非英语的学习者也从同学互评中受益(譬如,在爱沙尼亚和伊朗)。
舒安教授主修认知心理学,在学习与发展研究中心的跨学科尖端技术领域展开长达二十年的计算机辅助智能学习理论和实证研究,自1998年开始撰书立说,据Google Scholar不完全统计,至少有十篇文章平均引用次数200次以上,是认知科学跨学科发展的开拓者、先行者,杰出的国际知名中青年高级科学家。舒安教授主要致力于研发计算机辅助写作互评系统(SWoRD)和STEM教育学习工具。其开发的SWoRD已在美国、加拿大、澳大利亚、南韩、新加坡、爱沙尼亚等国家的上千门学术英语写作教学中使用,为学科英语写作质量和数量提高起到了不可估量的作用。SWoRD积累的后台数据为人工智能科学中的自然语言处理、认知心理学、写作科学的研究提供了充分的实证研究基础。
在此次访谈中,舒安教授分享了舒安实验室研发的SWoRD智能写作互评系统的建设全过程,涵盖计算机辅助写作互评系统的建设起因与价值、国际化应用与发展、系统竞争优势以及基于SWoRD系统的跨学科研究最新动态,从而给我国引进或建设计算机辅助学科写作教学和研究系统提供重要启示。
关键词:SWoRD写作互评系统;国际化应用;系统优势与劣势;跨学科后台研究
中图分类号:G434 文献标识码:A
在世界各国,学科写作是高校本科生和研究生的必修内容。指导教师经常要求学生就某一话题和相关文章进行阅读和写作,从而培养学生的专业素养、思辨能力和写作能力。可结果往往让人沮丧,学生普遍匮乏对所读文章的分析和综合能力,很难生成自己的观点和论证。
像任何技能发展一样,学科写作技能提高需要不断实践和评改,可写作点评永远是师资资源紧张的教学环节。庞大的工作量导致教师只能给每份作文提供有限的点评,并且不要求一文多稿。面对这一棘手的问题,美国、加拿大等发达国家很多高校筹建计算机辅助写作平台,引入同学互评良性机制,从而广泛提升各个学科英语写作的数量和质量。美国匹兹堡大学学习与发展研究中心舒安教授研发的SWoRD写作互评系统就是在这样的历史背景下应运而生。
访谈者:您开始筹建学科写作同学互评计算机辅助系统(SWoRD)是在2002年。十年后,全世界很多国家如美国、加拿大、韩国、新加坡、爱沙尼亚等已有一千多门课程使用SWoRD进行学术英语写作和互评学习,展示了这一辅助系统的市场需求和广泛应用性,以及其里程碑式的发展进程。我很好奇,究竟是什么动因激发您致力于开发SWoRD系统,并十年如一日立足发展壮大SWoRD写作互评系统?
舒安:其实开发写作互评系统的初衷源于我个人的教学需求。我过去一直从事大课教学,学生规模大都在200人以上。虽然深谙给学生布置写作任务有利于促进对知识和技能的综合掌握,但限于学生规模过于庞大,不能实现布置任务和提供反馈,这曾经让我经常愧疚不安。
一个偶然的机会,我听了一个让人灵感迸发的讲座,内容是关于怎样培训对飞行员的评估。听过之后,以往制约我尝试写作同学互评系统建设的顾虑消除了,我逐渐开始形成怎样让同学互评在课堂上真正行之有效的思路,并在大量研究写作评改系统建设和同学互评实证研究的基础上,筹划撰写系统建设项目申请书,从匹兹堡大学申请了一小笔项目资助,建设了SWoRD系统初始版。初始版系统功能比较简单,我原本可以就此结项,但我最终认定这将是一个很有趣的研究领域,如果能升级此系统,并利用SWoRD系统把教学、科研和应用结合起来,SWoRD系统前景会更好。
访谈者:学科写作和写作评改确实是各国高校都日益重视的技能。在写作教学资源紧张的情况下,同学互评起到了填补反馈空白或补充教师反馈的作用。但同学互评在研究和实践领域一直是褒贬俱存的写作教学策略。纳入计算机辅助平台增加了同学互评的复杂性。您怎么看待以SWoRD为代表的同学互评系统的价值和意义?
舒安:写作教学资源紧张是通病,同学互评和计算机技术结合是目前比较好的解决办法。计算机技术可以促使学生参与到一个更为有效的写作学习进程,提供给学生直接的反馈,并可以通过计算语言学的方法识别写作内容的各种问题,譬如论文的论证结构。
用同学互评来提高写作能力,会帮助学生聚焦写作的沟通和修辞功能。很多研究显示,作为写作和评改新手,学生读者往往对论文内容并不知情,学生作者收到学生读者的反馈,一般都会有个人写作策略失当的体会。同学互评还可以帮助学生树立正确的写作观。和直觉相背离的研究结果显示,提供反馈的能力和学生写作能力并不呈现相关性,也就是说,写作能力偏低的作者能给写作能力偏高的读者提供有效点评;同时提供点评的过程对点评提供者个人的写作能力亦有提高,尤其当学生提供建设性点评,并把这一努力运用到写作进程中。在学习理论研究中,同学互评和很多主动学习理论不谋而合,包括合作或协作学习、反馈提供式学习、反复实践式学习以及相关专业技能任务式学习等。
访谈者:正如您所预见的一样,您和您的团队,基于SWoRD展开系列的研究,且研究成果丰富。据我所知,至少十余篇论文发表在计算机与教育、教育心理学、指导科学、设计研究、技术、教学与教育、写作交流、写作研究等专业期刊上。您能说说基于SWoRD的代表性研究成果吗?
舒安:基于SWoRD的研究一方面立足于对计算机辅助教学设计的可行性、可靠性和效度进行长期的实验跟踪研究,但另一方面不局限于写作研究,还服务于认知、人工智能、心理学、教育学等交叉学科的研究主题。研究共性是几乎每一个学期都有基于此系统进行的教学、认知等实验。基于SWoRD的信度、效度和可靠性的研究从2006年开始有系列研究成果。目前,主要研究结论有:同伴从为他人提供的有建设性评价中学会更有效的写作;基于多人次同伴互评的文本修改,其效果较单人次专家评改效果可能更好;来自多位同伴互评的成绩比单一教师生成的成绩更有效;一般来讲,写作水平高低不同的学习者都会从反馈中受益;学生们利用计算机辅助图表分析文章脉络能产生更有效的文本。近期还会有引入评改工具、论文结构自动分析工具等结合同学互评系统研究的成果陆续发表。 访谈者:SWoRD功能齐全、界面良好,使其迅速成为商业化运作的教育产品“Peerceptiv”。您认为SWoRD系统商业化推广成功体现了哪些有指导意义的学习理论?实现了哪些教育设计理念或教育技术更新的需求?
舒安:在建设系统的过程中,我们吸纳了来自各个学科的学习理论和研究成果。首先,从写作学科的Flower和Hayes研究成果中,我们吸取了写作认知进程模式理论中的重要观点。该理论认为,写作进程的最佳理解方式是写作者导演或组织了一整套不同的思维进程。这些思维进程有级层性,彼此镶嵌交叉,为写作目标服务。作者主要以两种方式生成目标,一种是生成高级目标和辅助性分目标,从而体现作者的主要目的,然而在这一过程中,也可能以另外一种方式,即改变主要目标生成新目标。这些重要观点对同学互评系统中的教学干预如学习目标明示、自我反思表述等都起到了理论导向的作用。
从Vygotsky的教育发展理论来看,知识和技能习得的最近发展区出现在专家与新手、新手与新手的互动过程中。同学互评系统恰恰提供了这样的最近发展区。SWoRD不仅给予学生个体充分交流的机会,还在更大程度上促进分析和评价能力的生成,并通过内容和分数的评价及回评将最近发展区的发展模式进一步机制化。SWoRD的研究结果也佐证了最近发展区理论的可行性和有效性。
从Boh Siegler的策略发展理论以及各种各样的自我规约学习理论研究中,可以获得两个教学启示,学习者在评价解决办法方面的能力增强后能够产出更妥帖的解决方法;学习者必须规约自己的学习进程,而同学互评恰巧为培养这种规约性学习过程提供多种方式。
此外,学习科学是跨学科领域。我们的研究团队中有合理的跨学科人力资源梯队,譬如有心理学专家,计算机科学专家,也要有教育教学领域专家。在彼此充分沟通和合作的基础上,服务于学生共同体的教育设计才能真正满足教师学生的需要。以SWoRD为代表的计算机辅助写作互评系统就是在这样一个团队里,在互联网时代成为为写作学习共同体提供的强有力的教育设施。
访谈者:据我所知,全美至少还有两家商业化的同学互评系统,一个是Turnitin公司附加服务中的Peer Mark系统,一个是加利福尼亚大学提供的人T辅助同学互评系统。与这两大商业化系统相比,SWoRD写作互评系统的优势和劣势是什么?
舒安:SWoRD的独特之处在于采用信用压力等机制促使学生认真对待作文点评与评分。反复实验证明,当学生认为自己的点评和评分不会产生任何后果时,同学互评是起不到很大作用的。在此种情况下,学生通常给出最高的评分和最常见的简短好评(例如“写的不错”)。因此,Turnitin公司附加服务中的Peer Mark系统要求写作教师浏览所有评论后给分,倘若需要给分的话。实际上这份工作量远比单纯给学生批改作文要大要难,并不是很好的解决办法。
加利福尼亚大学的Calihrated Peer Review(CPR)系统给学生施加怎样评改作文的培训,并且培训质量很高,但并未对学生互评过程进行监控和影响。因此使用CPR系统的教师对互评结果喜忧参半。有个别新衍生出来的系统也尝试使用SWoRD的方法,尽管在有效性上还有很长的路要走,譬如MohiusSLIP,有比较复杂和混乱的工作界面,并且只支持作文整体评价。
诚然,SWoRD与另外两个领军系统相比在规模上小些,年纪轻些。加利福尼亚大学的CalihratedPeer Review(CPR)系统开发最早,在同学互评系统应用中知名度和使用规模上首屈一指,在作业设计上能够根据科学课中的很多学科建设共通的写作任务,从而起到帮助学生深入巩固本学科知识和技能的作用。Turnitin公司的知名度和广泛应用性主要体现在其对论文是否抄袭的评估和检测上,同学互评是其后附加的一个设计功能,并不在其公司规划中占据重要的发展角色。
访谈者:SWoRD已经应用于人文科学、社会科学、自然科学上千种课程的写作教学中。系统为有写作元素的课程融合更丰富的写作学习任务,也为需要添加写作要素但限于反馈局限问题的课程实现课程作业写作化,从而在不增加教师批改任务的前提下,帮助学生掌握学科的知识和技能。这本身已是壮举。您认为系统建设还有何其他重要教学效果?除了已经证实的教学效果,SWoRD写作互评系统旨在最大化教学效果的下一步努力是什么?
舒安:显而易见,SWoRD最明显的效果在于能给予学生很多写作练习的机会。另一个优势在于提供给学生非常难得的契机:从给予他人反馈中学习。我们的系列研究显示,给予他人反馈有至关重要的学习收获,有时比练习写作的收获更大。因为给予反馈集中体现了评者对作品的阅读、分析、综合、以及评判能力。在最大化教学效果方面,我们目前正在研究何种类型的写作任务,何样的同学互评评分标准能够更恰当地提供互评机会。
访谈者:与此同时,SWoRD也应用于很多高中和初中课程教学中。有研究显示,系统对学生写作质量和数量的提高起到了至关重要的作用。您认为在K-12教学中更大规模使用SWoRD面临什么样的机遇和挑战?
舒安:在高中和初中课程中使用SWoRD,我们要克服两个主要问题。第一个是技术层面的。大学生有很多机会使用计算机和网络,但高中生机会少很多。学校的计算机网络教室由众多班级共享,且因为年龄限制,对于很多校外网站禁止登录(因此像SWoRD写作互评教育资源网页也经常被设在禁登录范围内)。好在几乎所有的学生在家都享有个人电脑,因此中学的同学互评大都是在家里完成,学校仅偶尔在课上使用。第二个问题是教学层面的。在很多学校,教师已经习惯于避免布置写作作业,在教学中对何种写作任务能够促进教学效果并不了解。因此,我们正在集合来白优秀中学中的实例,教育学科和学术写作对写作内容、过程和方法的理念设计,筹建写作任务资源库和同学互评评价标准资源库,从而便于在宏观和微观上服务中学学科写作教学。 访谈者:计算机辅助写作同学互评涉及认知层面和合作层面的复杂性。SWoRD提供哪些具体措施帮助学生作者培训和提高评改技能?
舒安:SWoRD提供评改的视频培训,给出评改质量不一的具体实例帮助学生理解。系统还提供作者回评的工作界面,从而对评改质量进行反馈,包括详细解释为什么认为评改有帮助与否。
同时,SWoRD的人工智能功能会自动处理评改意见,从而给评改者关于评改质量的及时反馈。然而,这种反馈仍然是在不断进行的研究主题,因为我们对何种反馈能够起到最好的效果仍然没有定论。
访谈者:据我所知,两个最大的Mooc组织选用不同的方法评价学生提交的作业并打分。EdX、马萨诸塞和哈佛的非营利组织在2013年宣布他们会使用计算机辅助自动评分系统评估写作作业。Coursera、斯坦福大学建设的MOOC.系统对自动评分应用持怀疑态度,认为采用某种形式的人T为基础的同学互评系统来给写作打分和点评效果更好。
作为计算机辅助写作评价领域的专家,您对东西海岸的MOOC系统教育选择怎么看?就您所知,在这一领域有什么最新的情况吗?您可以谈谈自动评分系统和同学互评系统各白的潜力和局限吗?MOOC课程有使用SWoRD的可能性吗?
舒安:自动评分系统能为各类写作作业提供可靠有效的评分。现有很多研究显示,自动评分系统甚至比专家评分还要可靠。广泛使用自动评分的主要障碍其实是社会学层面的:普通人并不相信自动评分。这种障碍会随着时间推移逐渐改善。同样的恐惧见于各种自动化发展之初(譬如无人驾驶机器人车)。
然而,自动评分系统剥夺了作者彼此提供反馈的学习机会。此外,自动评分系统并不擅长提供实用的反馈意见。因此,我认为使用自动评分系统作为总结性和终结性评价是比较可取的,但对于使用自动评分系统作为学习过程中的形成性反馈并不可取。
一般的互评系统能为没有同学互评经验的学习者提供基础培训,然而匮乏信度保障机制意味着同学互评的质量依然停滞不前。SWoRD在这方面有明显的辅助优势。然而我认为在真正的MOOC大规模网上免费公开课程中,太多的学习者丝毫不在意真正的写作成绩如何。如果以后要求学习者支付少量费用,那么运用SWoRD会恰到好处。我认为在很多大学里,电子学习、远程学习会大幅度增长,SWoRD写作互评系统也很适合。
换句话说,大规模网上课程(Massive OnlineCourse,MOC)正好适用SWoRD,而大规模网上公开免费课程(比MOC多一个O=Open and Free)就不会那么奏效。
访谈者:基于SWoRD的研究涉及很多跨学科专业知识和技能,譬如计算机科学、写作教学法。您作为系统开发的始创人和负责人,是怎样把握这一系统所需要的计算机技术和教学理念设计呢?
舒安:在某种程度上来说,我的本科阶段有很多计算机科学学习背景,而卡耐基梅隆大学的博士学习包括大量的编程和人工智能,这些都恰好在SWoRD建设中加以运用。关于写作教学法,可以说,自从建设SWoRD伊始,我一直在和写作教学专家合作。譬如,我和奥斯丁得克萨斯大学研究修辞的Davida Charney教授,以及现在匹兹堡大学从事英语教育的Amanda Codley教授就写作都有密切合作。
访谈者:您的主要学术背景是认知心理学,为什么认知心理学研究和写作互评密切相关?换句话说,基于写作互评数据的认知心理学研究,开展什么研究主题呢?
舒安:认知心理学对研究专业知识发展的机制情有独钟。可关于专业知识发展的数据很少能从不良定义的问题解决中获取。写作恰是解决不良定义问题的经典例子。计算机辅助同学互评能够创造很多数据收集的机会,从而在庞大学生群体的研究样本中研究专业发展进程。
访谈者:SWoRD展示了数据科学和教育科学的经典融合,这也是未来研究的基本趋势。基于SWoRD有很多跨学科研究需求,那么跨学科研究有什么相同或不同的主线吗?
舒安:目前,我们正在研究跨学科写作作业如何共享的规律。每门课程都有其独特的教学目标和学生群体,这意味着数量小、质量高的作业并不能起到普遍和广泛的作用。如果每个指导教师都要开发与众不同的写作任务,SWoRD的使用效率会很低。因此我们着重研究跨学科写作任务相通的作业模式,并允许指导教师在已有其他老师布置的写作作业的基础上,设计新的写作作业,以便更好权衡内容适切度和写作效果。
访谈者:以SWoRD为代表的计算机辅助写作互评系统为例,您能谈谈这一领域目前的研究进展和研究方向吗?您在未来研究中,认为什么样的研究局面可算是下一个里程碑式的进展?
舒安:SWoRD所提供的互评基础支持可以有很强大的教学作用。但学会学科写作或者说学科论文写作对学生来说是一个更大的挑战。面对这一挑战,学生可以从附加的各种计算机技术支持中得到帮助。我们一直致力于开发SWoRD的多种升级功能,从而生成更值得推广的教学效果。譬如,同学互评作用的实现依赖于学生在确定写作的思考框架,并形成自己的初稿中做出大量工作。那么在写作教学的写前阶段,SWoRD能起到什么辅助作用呢?目前,我们正在尝试研究使用画论证图表的方法在写前阶段帮助学生梳理思路,且论证图表同样需要同学互评进行点评。另一主要相关项目涉及研究同学互评所引发的写作变化,即修改过程研究。譬如,我们帮助学生开发了修改计划实施工具,根据学生生成的点评生成修改界面。我们认为,促使学生对他们所得到的反馈明确态度和做法,有利于引导他们关注真正的修改过程。与此同时,我们试图基于实验数据生成计算方法,从而自动分析修改的本质,即修改仅是句法层面的,还是改变了论点和论证的质量。
访谈者:计算机辅助同学互评系统越来越成为很多其他国际教育机构争相开发的学习系统。在建设这样一个计算机辅助同学互评系统的过程中,您认为会遇到哪些主要的挑战?作为这一领域的权威专家,您能说说经验和建议吗?
舒安:任何计算机系统建设是团队充分合作的产物。除了有明确合理的系统建设目标和设计做指导,计算机信息技术以及教育技术的专业人才的配备和配合是必备条件。在此基础上,系统建设的软硬件定时维修维护需要大量人力物力的后期投入。系统建设的最终目的是应用,在应用于写作教学的过程中还会遇到很多挑战。尤其是当写作作为学习任务加入到一个以往没有或少有这一元素的教学情境时,面临教学者和学生的首要的问题是哪种写作任务适合学习者,这需要对具体学习情境进行反复调查和研究。SWoRD可以提供对任何写作任务和评价标准是否运行良好的诊断性统计算法,这使我们的研究工作容易有进展。
访谈者:SWoRD已经用于全世界众多国家1000多门课程。中国一贯把学术英语写作看作大学生专业素养培养的重要实现方式和大学教师学术水平的衡量尺度。您考虑过将SWoRD推向中国吗?
舒安:我认为中国确实有使用写作互评系统的潜力。二语习得研究显示,母语非英语的学习者也从同学互评中受益(譬如,在爱沙尼亚和伊朗)。