论文部分内容阅读
[摘 要] 美国加州标准化测验与报告项目针对全州、学区和学校,报告学生在加州基于课程标准的学业成就。以案例形式研究其信息处理的框架和具体的处理与利用过程,能为我国基于标准的评价实践提供有益的启示。
[关键词] 课程标准 基于标准的评价 标准化测验与报告项目
数据本身不会说话,数据之所以能告诉人们他们能明白的和需要的证据,就在于人们对数据的分析。我国实施的基于课程标准的学业成就测验很多是终结性的测验,按照我们的习惯思维,那最后的结果就是每个学生得到多少分,平均分是多少,然后是扩大到学校、学区、县、省等层面。这样的信息处理和交流不但不能告诉我们关于测验的有效信息,而且还会造成人们的不正确印象——测验就是看看学生分数的高低名次,判断教育质量的高低也是如此。根据对基于课程标准的学业成就测验特征的分析以及命题的规范分析,我们认为,基于标准的评价信息处理与报告要告诉大家测验分数背后代表的东西——达到了课程标准的要求了吗?哪些达到了,哪些没有?达到要求的程度怎样?然而,在国内这方面的实践比较欠缺,缺少直观的案例,美国加州标准化测验与报告项目(Standardized Testing and Reporting Program,STAR)可以为我们提供相应的参照与借鉴。
一、STAR项目的信息处理框架
STAR项目是美国加州州教育部在2007年以网络版的形式开发的,对全州、学区和学校报告学生在加州基于课程标准的学业成就。它以加州标准测验(California Standards Tests,CSTs)和加州替代性表现评价(California Alternate Performance Assessment,CAPA)这两种以州课程内容标准为基础的测验为主体;同时,为确保教育的公平,还辅之以加州成就测验(常模参照测验)和以西班牙语印刷的基于标准的测验。①(注:STAR项目介绍可以参看美国加州州教育部网址:http://star.cde.ca.gov)STAR项目首先总体规划各种学业成就测验的内容安排和年级安排,然后制订出各个年级的成绩水平分数线等,详见表1、2和3。
二、STAR项目测验信息的报告和利用
1. STAR项目测验信息的报告
加州学业成就测验结果的报告,有一个事先制订的严格而又明确的时间表(见表4)。按照学生所得的分数以及标准当中规定的成就水平,沿着既定的时间表,采用新闻发布、网上公布等方式向公众、学校和学生报告测验结果。某一个学生或者总的一项测验的结果报告是以州教育董事会认证的成绩水平来划分的,即按照优异、良好、合格、接近合格和远低于合格五个水平汇总,在具体的应用中也会用150~600之间的分数来说明测验结果(见表3)。就理想而言,加州希望所有的学生都能达到良好以上的水平。
2. 对学业成就测验结果的利用
最主要的运用场合是对学校的评价和问责,结合STAR的分数表现、辍学率、出席率等计算学校的年度表现,将学校和学区加以分类。就学校和学区而言,其结果分为模范、受认可、成就可接受和成就不被接受四个层次。同时,测验的结果也是学校绩效责任报告卡的重要内容。学校绩效责任报告卡包括学区任务与宗旨、学生成就资料、学生出席率、教师评价等15个方面的信息。看似很庞杂,但是版面设计和内容陈述都很简洁,易于大家理解和接受,从而能够接受这些信息对学校教育做出改进②(注:The California Department of Education,Explaining 2007 STAR Internet Reports to the Public. August 2007:5)。就问责而言,除了对达到较高水平的学校、教师和学生进行奖励,如增加办学经费、提供带薪学术休假、各种荣誉称号等之外,对成绩不达标的学校施以警告,对连续三年不合格的学校,州教育部甚至可以将学校解散重组。
另外,STAR主要报告的是学生在特定年级和州内容标准上的表现,随着总结性结果的上传,随之而来会有各种研究报告——主要是根据参加的具体年级和水平的考试人数、平均分数、在各个表现水平上的学生人数、学生的经济背景和语言程度,对学生的测验结果做出分析,尤其是体现在学生个人的成绩报告卡上,其报告形式的一部分参见表5,人们可以一目了然地了解学生的具体情况。
三、评论
1. 评价信息处理的根本目的在于促进学习
在教育领域中,学业成就测验一直受到心理测量学范式的影响,主张学生接受的测验应该是不受教学影响的,追求绝对客观、科学化的结论。测验与教育教学没什么关系。然而,在教育中,学业成就的评价核心就是判断学生经过特定的教育和教学经历后所达到的状态,我们更希望的是能够将考试和测验结果与教育实践结合起来,为教和学提供帮助。如同查普斯(Stephen Chappuis)等人指出的:“自20世纪中叶开始,美国的教育界就标准化测验的作用及效果一直没有达成共识。具体地说,在评价什么、为何评价、怎样评价及如何使用评价结果来支持学习这些问题上,我们并没有达成一致的看法。截至2005年,几乎没有证据表明这60多年来所使用的标准化测验对教育体系有什么重大的改进作用,这说明我们在处理评价与教学改进的关系上是失败的。”(注:① Stephen Chappuis,Richard Stiggins,Juth Arter
[关键词] 课程标准 基于标准的评价 标准化测验与报告项目
数据本身不会说话,数据之所以能告诉人们他们能明白的和需要的证据,就在于人们对数据的分析。我国实施的基于课程标准的学业成就测验很多是终结性的测验,按照我们的习惯思维,那最后的结果就是每个学生得到多少分,平均分是多少,然后是扩大到学校、学区、县、省等层面。这样的信息处理和交流不但不能告诉我们关于测验的有效信息,而且还会造成人们的不正确印象——测验就是看看学生分数的高低名次,判断教育质量的高低也是如此。根据对基于课程标准的学业成就测验特征的分析以及命题的规范分析,我们认为,基于标准的评价信息处理与报告要告诉大家测验分数背后代表的东西——达到了课程标准的要求了吗?哪些达到了,哪些没有?达到要求的程度怎样?然而,在国内这方面的实践比较欠缺,缺少直观的案例,美国加州标准化测验与报告项目(Standardized Testing and Reporting Program,STAR)可以为我们提供相应的参照与借鉴。
一、STAR项目的信息处理框架
STAR项目是美国加州州教育部在2007年以网络版的形式开发的,对全州、学区和学校报告学生在加州基于课程标准的学业成就。它以加州标准测验(California Standards Tests,CSTs)和加州替代性表现评价(California Alternate Performance Assessment,CAPA)这两种以州课程内容标准为基础的测验为主体;同时,为确保教育的公平,还辅之以加州成就测验(常模参照测验)和以西班牙语印刷的基于标准的测验。①(注:STAR项目介绍可以参看美国加州州教育部网址:http://star.cde.ca.gov)STAR项目首先总体规划各种学业成就测验的内容安排和年级安排,然后制订出各个年级的成绩水平分数线等,详见表1、2和3。

二、STAR项目测验信息的报告和利用
1. STAR项目测验信息的报告
加州学业成就测验结果的报告,有一个事先制订的严格而又明确的时间表(见表4)。按照学生所得的分数以及标准当中规定的成就水平,沿着既定的时间表,采用新闻发布、网上公布等方式向公众、学校和学生报告测验结果。某一个学生或者总的一项测验的结果报告是以州教育董事会认证的成绩水平来划分的,即按照优异、良好、合格、接近合格和远低于合格五个水平汇总,在具体的应用中也会用150~600之间的分数来说明测验结果(见表3)。就理想而言,加州希望所有的学生都能达到良好以上的水平。
2. 对学业成就测验结果的利用
最主要的运用场合是对学校的评价和问责,结合STAR的分数表现、辍学率、出席率等计算学校的年度表现,将学校和学区加以分类。就学校和学区而言,其结果分为模范、受认可、成就可接受和成就不被接受四个层次。同时,测验的结果也是学校绩效责任报告卡的重要内容。学校绩效责任报告卡包括学区任务与宗旨、学生成就资料、学生出席率、教师评价等15个方面的信息。看似很庞杂,但是版面设计和内容陈述都很简洁,易于大家理解和接受,从而能够接受这些信息对学校教育做出改进②(注:The California Department of Education,Explaining 2007 STAR Internet Reports to the Public. August 2007:5)。就问责而言,除了对达到较高水平的学校、教师和学生进行奖励,如增加办学经费、提供带薪学术休假、各种荣誉称号等之外,对成绩不达标的学校施以警告,对连续三年不合格的学校,州教育部甚至可以将学校解散重组。
另外,STAR主要报告的是学生在特定年级和州内容标准上的表现,随着总结性结果的上传,随之而来会有各种研究报告——主要是根据参加的具体年级和水平的考试人数、平均分数、在各个表现水平上的学生人数、学生的经济背景和语言程度,对学生的测验结果做出分析,尤其是体现在学生个人的成绩报告卡上,其报告形式的一部分参见表5,人们可以一目了然地了解学生的具体情况。

三、评论
1. 评价信息处理的根本目的在于促进学习
在教育领域中,学业成就测验一直受到心理测量学范式的影响,主张学生接受的测验应该是不受教学影响的,追求绝对客观、科学化的结论。测验与教育教学没什么关系。然而,在教育中,学业成就的评价核心就是判断学生经过特定的教育和教学经历后所达到的状态,我们更希望的是能够将考试和测验结果与教育实践结合起来,为教和学提供帮助。如同查普斯(Stephen Chappuis)等人指出的:“自20世纪中叶开始,美国的教育界就标准化测验的作用及效果一直没有达成共识。具体地说,在评价什么、为何评价、怎样评价及如何使用评价结果来支持学习这些问题上,我们并没有达成一致的看法。截至2005年,几乎没有证据表明这60多年来所使用的标准化测验对教育体系有什么重大的改进作用,这说明我们在处理评价与教学改进的关系上是失败的。”(注:① Stephen Chappuis,Richard Stiggins,Juth Arter