论文部分内容阅读
摘 要:学业评价是外语课程教学中的重要环节。外语专业的《英语专业本科教学质量国家标准》明确了外语学业评价要以实现促进学生学习为目标,注重形成性和终结性相结合的方式。本文辨析在形成性评价、终结性评价和档案袋评价几个概念的区别和联系的基础上,以《综合英语》课程为例,创造性地提出了以“终结性评价为主导,形成性评价为辅助”为原则的,适合外语单科课程教学的复合档案袋评价范式,以实现形成性和终结性评价的有效结合并使之融入学校的课程评价体系。
关键词:复合档案袋评价;形成性评价;终结性评价;结合
中图分类号:G42 文献标识码:A 文章编号:1003-6822(2016)04-0095-07
1. 引言
学业评价是高校外语课程教学的一个重要环节。现有的外语教学研究主要聚焦于教学环节而忽视学业评价环节。例如,2000版《高等学校英语专业英语教学大纲》(以下简称“《大纲》”)主要强调培养目标、课程设置、教学要求、教学原则以及教学方法和手段。至于学业评估环节,《大纲》只谈到作为终结性评价的测试和毕业论文,没有强调评价对教学的作用,也没有提及形成性评价。实际上,教学与评价是不可分割的,尤其在我国这样一个考试大国,无论对教师还是学生而言,学业评价有着举足轻重的地位。因此,我们有必要注重外语教学的学业评价,尤其是形成性评价。所幸的是,在教育部2015年出台的《英语专业本科教学质量国家标准》(以下简称“《国标》”)中,学业评价已被列为其重要内容。《国标》的终稿对学业评价的表述为:
评价应以促进学习为目的,根据培养方案确定评价的内容和标准,选择科学的评价方式和方法,合理使用评价结果,及时为教学提供反馈信息。注重形成性和终结性评价相结合。(仲伟合、潘鸣威,2015: 118)
《国标》明确了评价的目的是“以评促学”(assessment for learning)而不仅仅是“学业的评价”(assessment of learning)。这意味着,形成性评价在学业评价中的地位将得到凸显,而终结性评价则要合理使用,尤其不可过度使用。“注重形成性和终结性评价相结合”已成为评价体系的核心思想。无独有偶,除了教育部出台的外语《国标》外,全国各地的教育行政部门也在近年的文件中明确提出促进学业评价方式转变的思想。以浙江省为例,在2014年《浙江省教育厅关于印发《浙江省高校课堂教学质量创新行动计划(2014-2016)的通知》也明文规定:“建立形成性评价与终结性评价相结合的评价方法。完善平时成绩评定制度,增加日常考试评价在总成绩的比重,把学生的注意力转到学习过程上来”(浙教高教[2014]102号)。
虽然在我国目前的外语教学实施中,终结性评价还是作为最主要的学业评价方式一统天下,形成性评价融入教学还有待发展,但是对形成性评价的理论研究及其在外语教学中的应用研究已经在本世纪得到了起步和发展。然而,纵观现有的文献,我们发现,我国的外语形成性评价研究往往是完全脱离终结性评价的单方面研究,怎样与终结性和学习评价体系相结合的研究比较匮乏,且多半局限于理论引介和探讨,其必要性、重要性和实施原则谈论过多,而可操作性强的实施方法不足。虽有相关实证研究表明,形成性评估对学习自主性和学习成绩产生了显著的影响(如:章木林、宋红波,2014;洪民等,2011),但仅凭问卷调查和短期的成绩前后测比较,可信度并不高。此外,这些研究没有厘清形成性评价、终结性评价和档案袋评价之间的关系,通常把形成性评价和档案袋评价混为一谈,认为实施档案袋评价就是实现了形成性评价;同时也把大规模考试和期末考试与终结性评价混为一谈。本文将试图厘清这些概念之间的关系以消除对它们的误解,并同时以《综合英语》课程为例提出一套可操作性强的单科课程评价方式以实现形成性评价和终结性评价的有效结合并使之融入学校评价体系。
2. 运用复合档案袋评价,实现两种评价功能的有效统一
虽然西方学者早在上个世纪就提出形成性评价的概念并使之与终结性评价相区别(Hein & Price,1994; Black & William, 1998),国内学者(如王华、富长洪,2006)也专门从目的、时间、发生环境等不同角度对这两种评价方式做了区分。一般而言,两种评价的主要区别在于:形成性评价是在教学过程中为改进教与学的诊断性评价;终结性评价是在学习结束后所作的鉴定性评价。但是,笔者认为,在实际教学中,形成性和终结性评价没有明确的分割点。换句话说,形成性评价是相对于终结性评价而言的。形成性和终结性评价的区别首先取决于教学任务时间的界定。如果把一门课的每个章节看作为一个独立的教学任务,在章节结束后所作的单元测试就可以视作为终结性评价,而在这个阶段过程中的评价与反馈才有可能成为形成性评价。如果我们把这门课的学习阶段放大至整个学期,期末考试则应该视作为终结性评价,在此之前的评价都有可能成为形成性评价。但如果我们只把英语专业学习阶段定义为初级和高级两个阶段,学生在两个学年的所有评价都有可能成为形成性评价,专业四级和八级考试才应该是终结性评价。所以,要明确形成性和终结性评价的界定,首先要明确教学任务阶段的界定。通常,我们把一个学期的单科课程的教学任务看作为一个学习阶段,期末测试就自然可以视作为终结性评价。但是,这并不意味着,平时的课堂测试和期中测试等就是形成性评价。在明确学习阶段的基础上,形成性评价还必须满足学生在评价中发挥主体作用这一基本条件。这就是说,学生要与教师、同伴进行互动;学生在对评价内容进行自评、同伴互评、教师评价的基础上需要对学习过程和学习方法进行回顾和反思,从而促进学生的学习。因此,如果评价过程缺少了学生的主动性,平时课堂测试和课外作业的数量再多,它们在总评分中的比值再高都只能视作为经常性或者多阶段的终结性评价而不是形成性评价。反过来说,即便在平时的学习过程中,学生发挥了主动性,也不能完全摆脱终结性评价,因为平时测试的评价还是终结性的。纯粹的形成性评价几乎是不存在的。与其说形成性评价是和终结性评价相对应的一种评价方法,不如说形成性评价是一种评价理念。这种理念让原本纯粹的终结性评价方式产生变化,使评价主体从教师转变为学生,使评价由注重结果向注重过程转变。因此,评价的终结性是绝对的,而形成性是相对的。 值得注意的是,部分研究者把形成性评价与档案袋评价(portfolio assessmemt)混为一谈,或者认为形成性评价的具体操作方式就是档案袋评价。例如,姚兰芝(2012)认为形成性评价就是档案袋评价。她同时认为,档案袋评价就是“学生把自己一段时间内所有的成绩、历次的作业、各种测试成绩等都放在一起并加以文字记录(姚兰芝,2012: 95)”的一种测试评估形式。这是一种对形成性评价的严重误解。形成性评价的具体方式是多种多样的,weir & Roberts (1994)就列举了13种可以在外语教学中使用的形成性评价方式,包括课堂观察、日志、访谈、档案记录等。由此可见,档案袋评价只是评价的一种具体方式和工具。档案袋评价也可以是形成性的,也可以是终结性的。档案袋评价可以分为不同的类型,常见的分类有学习档案袋和评价档案袋。学习档案袋通常发挥档案袋形成性评价功能,而评价档案袋则发挥终结性功能。把历次的作业和各种测试成绩放在一起的档案袋评价是典型的评价档案袋。这种档案袋评价是终结性评价。如果把档案袋两种功能都发挥起来,这种评价方式就被称为复合档案袋评价(comprehensive portfolio assessment)。因此,复合档案袋评价的方法可以发挥形成性和终结性两种功能,在外语教学中具有较高的应用价值。本文接下来要解决的问题便是:在外语单科课程的学业评价中怎样在教学实践中实施复合档案袋评价,使得这种评价方式发挥其双重功能并融入学校评价体系。
3. 基于双重评价功能的复合档案袋法的具体实施
3.1 复合档案袋评价的应用原则
复合档案袋评价之所以适合于外语单科课程的学业评价是因为这种评价方式体现了三种复合特征:评价功能的复合;材料结构的复合;参与主体、评价主体、使用主体的复合以及评价标准的复合(洪民等,2011)。这样的复合评价方式使得学生既能注重学习结果也能重视学习过程,做到过程和结果的统一。值得探讨的是,复合档案袋评价作为双重评价工具,在评价过程中,到底应该发挥形成性功能为主还是终结性功能为主?笔者认为,结合我国的实际情况,仍然应该让终结性评价发挥决定性作用,让形成性评价作为其有效补充。以下为复合档案袋评价实施过程中的原则:
(1)发挥终结性评价功能的决定性作用。我国是考试故乡,是考试大国。各种层面的考试,从国家级的到省级的,从四六级考试到期末期中考试,历来都是终结性评价。虽然在西方国家包括香港地区已经开始广泛使用形成性评价,但是在我国要使形成性评价成为评价体系中主要部分,短期来看可行性不大。究其原因是因为考试与评价多半是高风险的,即考试成绩往往决定了考生在升学、毕业、谋职、评优评奖的命运,而我国考生更关注结果而非过程。这就意味着评价的效度(validity)和信度(reliability)必须得到保障,也就是说,评价必须是有效合理的。形成性评价因为评价标准的非定量性和评价主体不稳定性造成评价缺乏效度和信度。虽然,国内外专家(如Messick, 1989; 李清华、孔文,2015)都对形成性评价的效度和信度提出了验证框架,但是形成性评价是完全不同于终结性评价的个性化评价,它和终结性评价在效度和信度检验的出发点上存在根本性的区别。比如,李清华、孔文(2015: 24)认为形成性评价的效度取决于“评价结果的解释和使用是否和多大程度上真正促进了学生学习的进步”。这种过程为导向的效信度框架和目前我国学生以结果为导向的终结性评价效信度框架处于不同的层面,这就决定了形成性评价和终结性评价相结合的难度。假设形成性评价融入到学校评价体系并发挥主体作用,这种评价结果或许会遭到学生的质疑。因此,为了保证评价结果的说服力,有必要继续让复合档案袋评价中的终结性评价功能成为评价的主体,发挥其有效的反拨效应(washback effect)和决定性作用。
(2)发挥形成性评价功能的辅助性作用。形成性评价的意义不在于评价结果,而在于它的后效,即形成性评价多大程度上促进了学生的学习。大量的实证研究都表明,形成性评价对学习成绩、学习自主性和学习动机都起到了积极的效果。因此,在学业评价中,我们需要逐渐增大形成性评价的比重。档案袋评价中的形成性评价功能主要体现在:学习过程材料、报告、反思日志以及在此基础上的自评和互评等。学生在形成性评价过程中参与了目标的设定、材料的收集、学习的反思以及成绩评定。这个以学生为主体的自我反思、自我监控、自我评定、自我发展以及与教师、同伴互动的过程是终结性评价不可替代的,对教学的促进具有重要意义。因此,形成性评价的结果应该以一定的比例纳入课程的总体评价系统。如果形成性评价结果完全脱离于课程评价系统之外,评价过程和结果不容易引起学生足够的重视,这最终影响到形成性评价的效果和反拨效应;但如果形成性评价结果在课程评价系统所占的比重过大,学生容易对总评结果产生质疑,影响了效度、信度和可接受度。因此,笔者认为,立足于当前形势,形成性评价结果应该以较小的比例(课程总评的5%-20%之间)纳入课程评价系统中,发挥其辅助性功能。
3.2 与学校评价体系的融合的复合档案袋评价范式构建
笔者以自己所教的《综合英语》课程为例,设计出一套具有一定可操作性的复合档案袋评价框架。首先,按照现有多数学校百分制的单科课程评价体系,我们把课程的学业评价内容分解为不同的项目并确定各项的比重。例如,我们把课程评价内容大致分为平时评价、期中评价和期末评价三大项,确定它们的比例分别是70%、10%和20%;把平时评价内容细分为若干项(如表1所示)。这里值得一提的是,平时评价所占的比例一般不能低于50%。因为期中(如果学校不硬性规定需要期中评价,也可以由其他平时学习任务替代)和期末评价主要体现了评价的终结性功能,平时评价中仍然包含了终结性为主的评价,如果平时评价比例过低,很难体现出档案袋中的形成性评价的功能。从单个项目的角度看,项目的数量不能太少,单个项目的比例不能过高。考虑到期末测试信度和效度较高,学生可接受度也高,仍然可以列为所占比重最高的项目。 其次,我们需要明确单个项目的项目内容、项目评价目的、项目评价内容、项目次数、项目活动流程和评价标准。项目评价的重点在于构成平时成绩的单个项目的组成和设计。《综合英语》是英语专业低年级段的核心课程之一,其教学首要任务是训练外语听、说、读、写、译等基本功。平时项目内容应该从基本技能所涵盖的方面去选择,同时也要考虑到班级的现状。如果所教授的班级的阅读能力较差就多设置有关阅读能力的评价项目;如果教授班级的写作水平较差就多设置有关写作的项目,最终做到查漏补缺,均衡发展。此外,平时项目内容还应该体现课堂表现和测试、课外作业和课外自主学习等不同层面。尤其是体现课外自主学习的项目是不可缺少的,因为提高学习自主性是实施形成性评价的一个重要目的。考虑到英语专业学生课堂练习的机会比较少,我们可以设置课外口语作业。下面以课外口语项目为例,分别制定单个项目的评价目的、项目评价内容、项目次数、项目活动流程和评价标准。
课外口语项目的实施流程如下(见表2):学生以3-5人为一组进行自由组合,运用课外录制微视频的方式完成该口语项目。为了发挥学生的主体性,由学生以小组为单位确定活动主题和活动目标,并填写“口语活动计划表”。计划包括:活动目标、学习资源、活动方式、组员分工、口语训练安排、预期成果等,要求每次活动前由组员填写,明确本次口语活动的目标并合理规划。该步骤完成后,以小组为单位制作微视频,在此基础上进行组内评价与反思,填写“小组活动监控表”。“小组活动过程监控表”主要采用“成员自评+组内成员互评+成员反思”。“互评”采用抽签链式结构,每员负责连续监控下一位组员的口语参与情况,并做出书面评价; 被评组员进行反思撰写反思日志,以促进个体的自我监控。课外准备工作结束后,学生以小组为单位在课堂展示微视频,由教师和其他组代表做出个性化即时评价,并提出建设性意见。最后,学生根据这些评价进行进一步反思并重新制作微视频,随后,由教师审阅“口语活动计划表”、“小组活动过程监控表”和微视频作出终结性评价,填写课外口语项目总评表。
该课外口语的总评成绩应该把对学生学习过程的形成性评价和对学习成果的终结性评价都计入在内。因此,这里必须按照项目总评的评价内容、评价标准和评分比例制作项目总评表。表3为课外口语项目总评表的一个范例。在该总评表中,笔者把学习过程的评价(包括活动计划、自评、互评和反思等)和教师的终结性评价融合在一起,并对每次评价内容确定评价标准和评分比重。基于“终结性评价为主体”的原则,教师终评的比例应该占主导。具体的评分比重,不同的教师可以有不同的选择。但是,形成性评价的比重在单个项目中的比例需要得到控制。这个比例一旦失控,学生容易对总评结果产生质疑和不认可或者产生形成性评价趋同,失去其意义。
最后,我们需要在项目评价完成后进行存档。教师在期末根据所有单个项目的存档(包括平时项目、期中测试和期末测试)填写档案袋总评分表并计算学生在这门课的总评分(表1)。项目实施中,有些项目的次数是限定的,比如期中测试和期末测试,一般只进行一次。但是有些项目可以多次实施,比如听力、听写、口语等。多次项目一般采取最高成绩为该项目评价分。假设课外口语项目在一个学期中总共进行三次,每次活动结束后会得到项目总评分。三次口语活动的所有过程材料(微视频保存于U盘)都需要按要求整理纳入档案袋。学期末以总评得分最高的成绩作为该项目的得分。这样做的是为了给予学生更多的主动权,达到进一步提高学生学习动机和发挥学习自主性的目的。
4. 结语
《综合英语》课程可以实行档案袋评价的项目繁多,因为篇幅有限,本文不再一一列举。不同的项目所采取的评价方式有所区别。比如,课堂表现适合用观察法进行评价,课堂测试适合采取试卷+反思日志的形式,而课外自主学习则更多使用自评、互评和反思。虽然应用形成性评价来完成课外自主学习项目在教学实施中刚刚起步,但是相关研究表明,其效果和意义都十分显著。如洪民等(2011)用形成性评价实施的课外自主阅读既提高了学生的阅读成绩又激发了学生的阅读兴趣。因此,用形成性评价实施课外学习项目的数量和比重随着形成性评价的推广,应该得到逐步提升,改变目前终结性评价一统天下的状态。此外,考虑到目前学生还不完全适应形成性评价,一线教师对形成性评价的了解也不多,有必要对一线教师进行适当的培训,教师在实施形成性评价之前也应该给学生足够的意识提升。外语学业评价从完全终结性评价到“形成性评价与终结性评价相结合”必定是个漫长的过程。在目前条件尚未成熟的情况下,教师也可以利用复合档案袋方式将“多次平时测试+期中+期末”型的多阶段性的终结性档案袋评价作为过渡评价形式,然后逐步实施“形成性”与“终结性”相结合的评价。外语教学课程中,不仅《综合英语》课程可以实施复合档案袋评价,其他多数技能课程和知识课程,如《英语写作》、《英语阅读》、《英美国家概况》《英美文学作品选读》等也都有较大的可行性。
评价方式关系到人才培养的教学效果。要改革现有的高校外语专业教学,我们除了要改变课程设置也需要实行多元化的评价方式和评价标准,并把《国标》提及的技能性、知识性和思辨性充分的融入进课程评价中,以促进教与学的发展。复合档案袋评价是具有较大可行性和可操作性的评价方式。随着电子档案袋系统平台的开发和电子档案袋评价的应用,其资源共享的功能将得到进一步凸显,这种评价方式也必将会有更好的发展。
参 考 文 献
Black, P. & D. William. Inside the black box: Raising standard through classroom assessment[J]. Phi Delta Kappan, 1998,(2):139-148.
Hein, G. & S. Price. Active Assessment for Active Science [M]. Portsmouth, NH: Heinemann, 1994. Messick, S. Validity In Linn, R. L. (ed.). Educational Measurement [C]. New York: Macmillan, 1989: 13-103.
Weir, C. J. & J. Roberts. Evaluation in ELT [M]. London: Blackwell Publisher,1994.
高等学校外语专业教学指导委员会英语组. 高等学校英语专业英语教学大纲[Z]. 上海:上海外语教育出版社,2000.
洪民、詹先君、赵景梅.复合型档案袋评价对外语阅读能力的影响[J]. 外语界,2011,(2): 82-89.
李清华、孔文.外语形成性评价的效度验证框架[J]. 外语教学理论与实践,2015,(1): 24-31.
王 华、富长洪.形成性评估在外语教学中的应用研究综述[J]. 外语界,2006,(4): 67-72.
姚兰芝.试论形成性评价在高校教学中的作用[J]. 江苏高教,2012,(2): 95-96.
章木林、宋红波.档案袋评价与英语自主学习能力培养的关系[J]. 天津外国语大学学报,2014,(2): 42-48.
仲伟合、潘鸣威.论《英语专业本科教学质量国家标准》的制定—创新和思考[J]. 现代外语,2015,(1): 112-121.
The Integration of Formative and Summative Assessment in English Major Courses
——Taking Comprehensive English as an Example
LOU Jie
(Foreign Language College, Zhejiang Shuren University, Hangzhou 310015)
Abstract: Learning assessment is a key part in FL teaching. The FL National Standard proposes that learning assessment needs to integrate both formative and summative assessment, to enhance the learning development. The paper differentiates the key conceptions of formative assessment, summative assessment and portfolio assessment, and analyzes their relations. Based on the analysis, this paper takes comprehensive English as an example to propose applying comprehensive portfolio assessment in FL course. The paradigm is creatively put forward afterwards based on the principle of summative assessment-directed and formative assessment-assisted, aiming to realizing the integration of both formative and summative assessment in school assessment system of FL courses.
Key Words: comprehensive assessment; formative assessment; summative assessment; integration
作者简介:楼捷,男,硕士,浙江树人大学外国语学院讲师。主要从事二语习得研究。
通讯地址:杭州市树人街8号浙江树人大学外国语学院,邮编310015
E-mail:[email protected]
(责任编辑:邹春燕)
关键词:复合档案袋评价;形成性评价;终结性评价;结合
中图分类号:G42 文献标识码:A 文章编号:1003-6822(2016)04-0095-07
1. 引言
学业评价是高校外语课程教学的一个重要环节。现有的外语教学研究主要聚焦于教学环节而忽视学业评价环节。例如,2000版《高等学校英语专业英语教学大纲》(以下简称“《大纲》”)主要强调培养目标、课程设置、教学要求、教学原则以及教学方法和手段。至于学业评估环节,《大纲》只谈到作为终结性评价的测试和毕业论文,没有强调评价对教学的作用,也没有提及形成性评价。实际上,教学与评价是不可分割的,尤其在我国这样一个考试大国,无论对教师还是学生而言,学业评价有着举足轻重的地位。因此,我们有必要注重外语教学的学业评价,尤其是形成性评价。所幸的是,在教育部2015年出台的《英语专业本科教学质量国家标准》(以下简称“《国标》”)中,学业评价已被列为其重要内容。《国标》的终稿对学业评价的表述为:
评价应以促进学习为目的,根据培养方案确定评价的内容和标准,选择科学的评价方式和方法,合理使用评价结果,及时为教学提供反馈信息。注重形成性和终结性评价相结合。(仲伟合、潘鸣威,2015: 118)
《国标》明确了评价的目的是“以评促学”(assessment for learning)而不仅仅是“学业的评价”(assessment of learning)。这意味着,形成性评价在学业评价中的地位将得到凸显,而终结性评价则要合理使用,尤其不可过度使用。“注重形成性和终结性评价相结合”已成为评价体系的核心思想。无独有偶,除了教育部出台的外语《国标》外,全国各地的教育行政部门也在近年的文件中明确提出促进学业评价方式转变的思想。以浙江省为例,在2014年《浙江省教育厅关于印发《浙江省高校课堂教学质量创新行动计划(2014-2016)的通知》也明文规定:“建立形成性评价与终结性评价相结合的评价方法。完善平时成绩评定制度,增加日常考试评价在总成绩的比重,把学生的注意力转到学习过程上来”(浙教高教[2014]102号)。
虽然在我国目前的外语教学实施中,终结性评价还是作为最主要的学业评价方式一统天下,形成性评价融入教学还有待发展,但是对形成性评价的理论研究及其在外语教学中的应用研究已经在本世纪得到了起步和发展。然而,纵观现有的文献,我们发现,我国的外语形成性评价研究往往是完全脱离终结性评价的单方面研究,怎样与终结性和学习评价体系相结合的研究比较匮乏,且多半局限于理论引介和探讨,其必要性、重要性和实施原则谈论过多,而可操作性强的实施方法不足。虽有相关实证研究表明,形成性评估对学习自主性和学习成绩产生了显著的影响(如:章木林、宋红波,2014;洪民等,2011),但仅凭问卷调查和短期的成绩前后测比较,可信度并不高。此外,这些研究没有厘清形成性评价、终结性评价和档案袋评价之间的关系,通常把形成性评价和档案袋评价混为一谈,认为实施档案袋评价就是实现了形成性评价;同时也把大规模考试和期末考试与终结性评价混为一谈。本文将试图厘清这些概念之间的关系以消除对它们的误解,并同时以《综合英语》课程为例提出一套可操作性强的单科课程评价方式以实现形成性评价和终结性评价的有效结合并使之融入学校评价体系。
2. 运用复合档案袋评价,实现两种评价功能的有效统一
虽然西方学者早在上个世纪就提出形成性评价的概念并使之与终结性评价相区别(Hein & Price,1994; Black & William, 1998),国内学者(如王华、富长洪,2006)也专门从目的、时间、发生环境等不同角度对这两种评价方式做了区分。一般而言,两种评价的主要区别在于:形成性评价是在教学过程中为改进教与学的诊断性评价;终结性评价是在学习结束后所作的鉴定性评价。但是,笔者认为,在实际教学中,形成性和终结性评价没有明确的分割点。换句话说,形成性评价是相对于终结性评价而言的。形成性和终结性评价的区别首先取决于教学任务时间的界定。如果把一门课的每个章节看作为一个独立的教学任务,在章节结束后所作的单元测试就可以视作为终结性评价,而在这个阶段过程中的评价与反馈才有可能成为形成性评价。如果我们把这门课的学习阶段放大至整个学期,期末考试则应该视作为终结性评价,在此之前的评价都有可能成为形成性评价。但如果我们只把英语专业学习阶段定义为初级和高级两个阶段,学生在两个学年的所有评价都有可能成为形成性评价,专业四级和八级考试才应该是终结性评价。所以,要明确形成性和终结性评价的界定,首先要明确教学任务阶段的界定。通常,我们把一个学期的单科课程的教学任务看作为一个学习阶段,期末测试就自然可以视作为终结性评价。但是,这并不意味着,平时的课堂测试和期中测试等就是形成性评价。在明确学习阶段的基础上,形成性评价还必须满足学生在评价中发挥主体作用这一基本条件。这就是说,学生要与教师、同伴进行互动;学生在对评价内容进行自评、同伴互评、教师评价的基础上需要对学习过程和学习方法进行回顾和反思,从而促进学生的学习。因此,如果评价过程缺少了学生的主动性,平时课堂测试和课外作业的数量再多,它们在总评分中的比值再高都只能视作为经常性或者多阶段的终结性评价而不是形成性评价。反过来说,即便在平时的学习过程中,学生发挥了主动性,也不能完全摆脱终结性评价,因为平时测试的评价还是终结性的。纯粹的形成性评价几乎是不存在的。与其说形成性评价是和终结性评价相对应的一种评价方法,不如说形成性评价是一种评价理念。这种理念让原本纯粹的终结性评价方式产生变化,使评价主体从教师转变为学生,使评价由注重结果向注重过程转变。因此,评价的终结性是绝对的,而形成性是相对的。 值得注意的是,部分研究者把形成性评价与档案袋评价(portfolio assessmemt)混为一谈,或者认为形成性评价的具体操作方式就是档案袋评价。例如,姚兰芝(2012)认为形成性评价就是档案袋评价。她同时认为,档案袋评价就是“学生把自己一段时间内所有的成绩、历次的作业、各种测试成绩等都放在一起并加以文字记录(姚兰芝,2012: 95)”的一种测试评估形式。这是一种对形成性评价的严重误解。形成性评价的具体方式是多种多样的,weir & Roberts (1994)就列举了13种可以在外语教学中使用的形成性评价方式,包括课堂观察、日志、访谈、档案记录等。由此可见,档案袋评价只是评价的一种具体方式和工具。档案袋评价也可以是形成性的,也可以是终结性的。档案袋评价可以分为不同的类型,常见的分类有学习档案袋和评价档案袋。学习档案袋通常发挥档案袋形成性评价功能,而评价档案袋则发挥终结性功能。把历次的作业和各种测试成绩放在一起的档案袋评价是典型的评价档案袋。这种档案袋评价是终结性评价。如果把档案袋两种功能都发挥起来,这种评价方式就被称为复合档案袋评价(comprehensive portfolio assessment)。因此,复合档案袋评价的方法可以发挥形成性和终结性两种功能,在外语教学中具有较高的应用价值。本文接下来要解决的问题便是:在外语单科课程的学业评价中怎样在教学实践中实施复合档案袋评价,使得这种评价方式发挥其双重功能并融入学校评价体系。
3. 基于双重评价功能的复合档案袋法的具体实施
3.1 复合档案袋评价的应用原则
复合档案袋评价之所以适合于外语单科课程的学业评价是因为这种评价方式体现了三种复合特征:评价功能的复合;材料结构的复合;参与主体、评价主体、使用主体的复合以及评价标准的复合(洪民等,2011)。这样的复合评价方式使得学生既能注重学习结果也能重视学习过程,做到过程和结果的统一。值得探讨的是,复合档案袋评价作为双重评价工具,在评价过程中,到底应该发挥形成性功能为主还是终结性功能为主?笔者认为,结合我国的实际情况,仍然应该让终结性评价发挥决定性作用,让形成性评价作为其有效补充。以下为复合档案袋评价实施过程中的原则:
(1)发挥终结性评价功能的决定性作用。我国是考试故乡,是考试大国。各种层面的考试,从国家级的到省级的,从四六级考试到期末期中考试,历来都是终结性评价。虽然在西方国家包括香港地区已经开始广泛使用形成性评价,但是在我国要使形成性评价成为评价体系中主要部分,短期来看可行性不大。究其原因是因为考试与评价多半是高风险的,即考试成绩往往决定了考生在升学、毕业、谋职、评优评奖的命运,而我国考生更关注结果而非过程。这就意味着评价的效度(validity)和信度(reliability)必须得到保障,也就是说,评价必须是有效合理的。形成性评价因为评价标准的非定量性和评价主体不稳定性造成评价缺乏效度和信度。虽然,国内外专家(如Messick, 1989; 李清华、孔文,2015)都对形成性评价的效度和信度提出了验证框架,但是形成性评价是完全不同于终结性评价的个性化评价,它和终结性评价在效度和信度检验的出发点上存在根本性的区别。比如,李清华、孔文(2015: 24)认为形成性评价的效度取决于“评价结果的解释和使用是否和多大程度上真正促进了学生学习的进步”。这种过程为导向的效信度框架和目前我国学生以结果为导向的终结性评价效信度框架处于不同的层面,这就决定了形成性评价和终结性评价相结合的难度。假设形成性评价融入到学校评价体系并发挥主体作用,这种评价结果或许会遭到学生的质疑。因此,为了保证评价结果的说服力,有必要继续让复合档案袋评价中的终结性评价功能成为评价的主体,发挥其有效的反拨效应(washback effect)和决定性作用。
(2)发挥形成性评价功能的辅助性作用。形成性评价的意义不在于评价结果,而在于它的后效,即形成性评价多大程度上促进了学生的学习。大量的实证研究都表明,形成性评价对学习成绩、学习自主性和学习动机都起到了积极的效果。因此,在学业评价中,我们需要逐渐增大形成性评价的比重。档案袋评价中的形成性评价功能主要体现在:学习过程材料、报告、反思日志以及在此基础上的自评和互评等。学生在形成性评价过程中参与了目标的设定、材料的收集、学习的反思以及成绩评定。这个以学生为主体的自我反思、自我监控、自我评定、自我发展以及与教师、同伴互动的过程是终结性评价不可替代的,对教学的促进具有重要意义。因此,形成性评价的结果应该以一定的比例纳入课程的总体评价系统。如果形成性评价结果完全脱离于课程评价系统之外,评价过程和结果不容易引起学生足够的重视,这最终影响到形成性评价的效果和反拨效应;但如果形成性评价结果在课程评价系统所占的比重过大,学生容易对总评结果产生质疑,影响了效度、信度和可接受度。因此,笔者认为,立足于当前形势,形成性评价结果应该以较小的比例(课程总评的5%-20%之间)纳入课程评价系统中,发挥其辅助性功能。
3.2 与学校评价体系的融合的复合档案袋评价范式构建
笔者以自己所教的《综合英语》课程为例,设计出一套具有一定可操作性的复合档案袋评价框架。首先,按照现有多数学校百分制的单科课程评价体系,我们把课程的学业评价内容分解为不同的项目并确定各项的比重。例如,我们把课程评价内容大致分为平时评价、期中评价和期末评价三大项,确定它们的比例分别是70%、10%和20%;把平时评价内容细分为若干项(如表1所示)。这里值得一提的是,平时评价所占的比例一般不能低于50%。因为期中(如果学校不硬性规定需要期中评价,也可以由其他平时学习任务替代)和期末评价主要体现了评价的终结性功能,平时评价中仍然包含了终结性为主的评价,如果平时评价比例过低,很难体现出档案袋中的形成性评价的功能。从单个项目的角度看,项目的数量不能太少,单个项目的比例不能过高。考虑到期末测试信度和效度较高,学生可接受度也高,仍然可以列为所占比重最高的项目。 其次,我们需要明确单个项目的项目内容、项目评价目的、项目评价内容、项目次数、项目活动流程和评价标准。项目评价的重点在于构成平时成绩的单个项目的组成和设计。《综合英语》是英语专业低年级段的核心课程之一,其教学首要任务是训练外语听、说、读、写、译等基本功。平时项目内容应该从基本技能所涵盖的方面去选择,同时也要考虑到班级的现状。如果所教授的班级的阅读能力较差就多设置有关阅读能力的评价项目;如果教授班级的写作水平较差就多设置有关写作的项目,最终做到查漏补缺,均衡发展。此外,平时项目内容还应该体现课堂表现和测试、课外作业和课外自主学习等不同层面。尤其是体现课外自主学习的项目是不可缺少的,因为提高学习自主性是实施形成性评价的一个重要目的。考虑到英语专业学生课堂练习的机会比较少,我们可以设置课外口语作业。下面以课外口语项目为例,分别制定单个项目的评价目的、项目评价内容、项目次数、项目活动流程和评价标准。
课外口语项目的实施流程如下(见表2):学生以3-5人为一组进行自由组合,运用课外录制微视频的方式完成该口语项目。为了发挥学生的主体性,由学生以小组为单位确定活动主题和活动目标,并填写“口语活动计划表”。计划包括:活动目标、学习资源、活动方式、组员分工、口语训练安排、预期成果等,要求每次活动前由组员填写,明确本次口语活动的目标并合理规划。该步骤完成后,以小组为单位制作微视频,在此基础上进行组内评价与反思,填写“小组活动监控表”。“小组活动过程监控表”主要采用“成员自评+组内成员互评+成员反思”。“互评”采用抽签链式结构,每员负责连续监控下一位组员的口语参与情况,并做出书面评价; 被评组员进行反思撰写反思日志,以促进个体的自我监控。课外准备工作结束后,学生以小组为单位在课堂展示微视频,由教师和其他组代表做出个性化即时评价,并提出建设性意见。最后,学生根据这些评价进行进一步反思并重新制作微视频,随后,由教师审阅“口语活动计划表”、“小组活动过程监控表”和微视频作出终结性评价,填写课外口语项目总评表。
该课外口语的总评成绩应该把对学生学习过程的形成性评价和对学习成果的终结性评价都计入在内。因此,这里必须按照项目总评的评价内容、评价标准和评分比例制作项目总评表。表3为课外口语项目总评表的一个范例。在该总评表中,笔者把学习过程的评价(包括活动计划、自评、互评和反思等)和教师的终结性评价融合在一起,并对每次评价内容确定评价标准和评分比重。基于“终结性评价为主体”的原则,教师终评的比例应该占主导。具体的评分比重,不同的教师可以有不同的选择。但是,形成性评价的比重在单个项目中的比例需要得到控制。这个比例一旦失控,学生容易对总评结果产生质疑和不认可或者产生形成性评价趋同,失去其意义。
最后,我们需要在项目评价完成后进行存档。教师在期末根据所有单个项目的存档(包括平时项目、期中测试和期末测试)填写档案袋总评分表并计算学生在这门课的总评分(表1)。项目实施中,有些项目的次数是限定的,比如期中测试和期末测试,一般只进行一次。但是有些项目可以多次实施,比如听力、听写、口语等。多次项目一般采取最高成绩为该项目评价分。假设课外口语项目在一个学期中总共进行三次,每次活动结束后会得到项目总评分。三次口语活动的所有过程材料(微视频保存于U盘)都需要按要求整理纳入档案袋。学期末以总评得分最高的成绩作为该项目的得分。这样做的是为了给予学生更多的主动权,达到进一步提高学生学习动机和发挥学习自主性的目的。
4. 结语
《综合英语》课程可以实行档案袋评价的项目繁多,因为篇幅有限,本文不再一一列举。不同的项目所采取的评价方式有所区别。比如,课堂表现适合用观察法进行评价,课堂测试适合采取试卷+反思日志的形式,而课外自主学习则更多使用自评、互评和反思。虽然应用形成性评价来完成课外自主学习项目在教学实施中刚刚起步,但是相关研究表明,其效果和意义都十分显著。如洪民等(2011)用形成性评价实施的课外自主阅读既提高了学生的阅读成绩又激发了学生的阅读兴趣。因此,用形成性评价实施课外学习项目的数量和比重随着形成性评价的推广,应该得到逐步提升,改变目前终结性评价一统天下的状态。此外,考虑到目前学生还不完全适应形成性评价,一线教师对形成性评价的了解也不多,有必要对一线教师进行适当的培训,教师在实施形成性评价之前也应该给学生足够的意识提升。外语学业评价从完全终结性评价到“形成性评价与终结性评价相结合”必定是个漫长的过程。在目前条件尚未成熟的情况下,教师也可以利用复合档案袋方式将“多次平时测试+期中+期末”型的多阶段性的终结性档案袋评价作为过渡评价形式,然后逐步实施“形成性”与“终结性”相结合的评价。外语教学课程中,不仅《综合英语》课程可以实施复合档案袋评价,其他多数技能课程和知识课程,如《英语写作》、《英语阅读》、《英美国家概况》《英美文学作品选读》等也都有较大的可行性。
评价方式关系到人才培养的教学效果。要改革现有的高校外语专业教学,我们除了要改变课程设置也需要实行多元化的评价方式和评价标准,并把《国标》提及的技能性、知识性和思辨性充分的融入进课程评价中,以促进教与学的发展。复合档案袋评价是具有较大可行性和可操作性的评价方式。随着电子档案袋系统平台的开发和电子档案袋评价的应用,其资源共享的功能将得到进一步凸显,这种评价方式也必将会有更好的发展。
参 考 文 献
Black, P. & D. William. Inside the black box: Raising standard through classroom assessment[J]. Phi Delta Kappan, 1998,(2):139-148.
Hein, G. & S. Price. Active Assessment for Active Science [M]. Portsmouth, NH: Heinemann, 1994. Messick, S. Validity In Linn, R. L. (ed.). Educational Measurement [C]. New York: Macmillan, 1989: 13-103.
Weir, C. J. & J. Roberts. Evaluation in ELT [M]. London: Blackwell Publisher,1994.
高等学校外语专业教学指导委员会英语组. 高等学校英语专业英语教学大纲[Z]. 上海:上海外语教育出版社,2000.
洪民、詹先君、赵景梅.复合型档案袋评价对外语阅读能力的影响[J]. 外语界,2011,(2): 82-89.
李清华、孔文.外语形成性评价的效度验证框架[J]. 外语教学理论与实践,2015,(1): 24-31.
王 华、富长洪.形成性评估在外语教学中的应用研究综述[J]. 外语界,2006,(4): 67-72.
姚兰芝.试论形成性评价在高校教学中的作用[J]. 江苏高教,2012,(2): 95-96.
章木林、宋红波.档案袋评价与英语自主学习能力培养的关系[J]. 天津外国语大学学报,2014,(2): 42-48.
仲伟合、潘鸣威.论《英语专业本科教学质量国家标准》的制定—创新和思考[J]. 现代外语,2015,(1): 112-121.
The Integration of Formative and Summative Assessment in English Major Courses
——Taking Comprehensive English as an Example
LOU Jie
(Foreign Language College, Zhejiang Shuren University, Hangzhou 310015)
Abstract: Learning assessment is a key part in FL teaching. The FL National Standard proposes that learning assessment needs to integrate both formative and summative assessment, to enhance the learning development. The paper differentiates the key conceptions of formative assessment, summative assessment and portfolio assessment, and analyzes their relations. Based on the analysis, this paper takes comprehensive English as an example to propose applying comprehensive portfolio assessment in FL course. The paradigm is creatively put forward afterwards based on the principle of summative assessment-directed and formative assessment-assisted, aiming to realizing the integration of both formative and summative assessment in school assessment system of FL courses.
Key Words: comprehensive assessment; formative assessment; summative assessment; integration
作者简介:楼捷,男,硕士,浙江树人大学外国语学院讲师。主要从事二语习得研究。
通讯地址:杭州市树人街8号浙江树人大学外国语学院,邮编310015
E-mail:[email protected]
(责任编辑:邹春燕)