论文部分内容阅读
摘要:进入21世纪人们对大学英语四、六级考试(以下简称为CET)的争议从未停止。本文通过剖析CET的测量学属性,分析了它的多重功能,即CET具有很强的选拔和区分功能,一定的判断学生是否达到课程教学要求的功能,以及测量学生实际运用英语能力。从分析中得到的启示是CET复杂的测量学属性和多重功能有可能是引起人们对CET争议的原因之一,为了让CET更好地发挥它的作用,CET应该使其功能单一化。
关键词:大学英语四、六级考试;常模参照的测试;尺度参照的测试;学业考试;水平考试
中图分类号:G640 文献标志码:A 文章编号:1674-9324(2012)12-0110-03
一、引言
大学英语四、六级考试对中国英语教学和学生英语水平的提高起了较大作用,但是进入21世纪后对它的争议从未停止(如韩宝成,2002;刘润清,2003;钱冠连,2003;陈祖芳,2004;韩宝成 戴曼纯等,2004;王初明,2006)。有学者质疑CET是否准确地测量学生的英语水平(如蔡基刚,2007;韩宝成、戴曼纯等,2004)。有学者关注CET对大学英语教育和学习是否有促进作用。有些研究表明CET对大学英语教育和学习带来负面影响(如井升华,1999;牛强,2001;肖云南 罗晓英,2002;李炯英,2002;高远,2003);有的研究结果表明它的正面反拨效应大于其负面反拨效应(如辜向东,2007;叶菊仙,1998)。对CET进行改革已是大势所趋,教育决策者、CET研究开发单位和语言教育专家都从不同的视角提出CET的改革发展方向(张尧学,2003,2008;金艳,2004,2006;王初明,2006;蔡基刚,2007)。基于分析CET复杂的测量学属性和它的多重功能,本文探讨了对CET争议的原因。
二、CET的测量学属性
分析CET的性质是理解对CET争议的重要视角之一。它本身是一个什么性质的考试,考试研发者期望它能满足什么样的功能,而质疑者认为它应该是什么样的考试,它应该在社会和教育界起什么样的作用,角度不同,答案也不一样,因此分析他们之间的偏差可以更好地理解对CET的争议。用来描述语言考试和评估的专有名词很多。根据不同的解释测试结果的参照系,心理测量研究人员通常把测试分为标准参照(criterion-referenced)和常模参照(norm-referenced)考试;根据考试内容选取的依据,考试通常分为学业考试(achievement test)和水平考试(proficiency test)(Bachman,1990;徐强,2000;束定芳 庄智象,1996);根据不同的评估型式,考试分为形成性(formative)和终结性(summative)评估。下文将以测试的不同分类方法为视角对CET的测量学属性进行剖析。
1.CET是常模参照-尺度相关的考试。心理测量理论认为如果测试的结果是参照某一标准进行解释(语言能力等级量表或教学大纲标准),该考试被称之为标准参照。比如雅思把语言能力分为十个等级,每一个等级用语言进行定性的描述,达到某个等级就表示该考生能用语言完成所描述的功能。根据雅思的能力等级量表如果一个考生“有能力运用英语,虽然在某些情况有时会发生不准确、不适当和误解,基本上能很好地掌握复杂的英语句子,也能理解推理的细节”,该考生的语言能力为七级。而常模参照考试是以某一常模作为参照系来解释考生的成绩。常模是由测试单位选取的,呈正态分布的用均值和标准差来进行描述的标准化样组。考生的成绩是以它在常模中所处的位置来解释的。如果某一考生的原始分数与常模的均值大一个标准差,他的能力就可以解释为比84.13%的考生强。因此,从分数解释的参照系的角度出发,CET是常模参照性的考试。常模是由北京大学,清华大学,上海交通大学,复旦大学,中国科技大学和西安交通大学本科生组成。这样选取常模是因为考试的最初设计测量对象是重点大学本科生。后来CET扩展到全国普通高校,并用小于常模均值一个标准差作为及格线(杨惠中
关键词:大学英语四、六级考试;常模参照的测试;尺度参照的测试;学业考试;水平考试
中图分类号:G640 文献标志码:A 文章编号:1674-9324(2012)12-0110-03
一、引言
大学英语四、六级考试对中国英语教学和学生英语水平的提高起了较大作用,但是进入21世纪后对它的争议从未停止(如韩宝成,2002;刘润清,2003;钱冠连,2003;陈祖芳,2004;韩宝成 戴曼纯等,2004;王初明,2006)。有学者质疑CET是否准确地测量学生的英语水平(如蔡基刚,2007;韩宝成、戴曼纯等,2004)。有学者关注CET对大学英语教育和学习是否有促进作用。有些研究表明CET对大学英语教育和学习带来负面影响(如井升华,1999;牛强,2001;肖云南 罗晓英,2002;李炯英,2002;高远,2003);有的研究结果表明它的正面反拨效应大于其负面反拨效应(如辜向东,2007;叶菊仙,1998)。对CET进行改革已是大势所趋,教育决策者、CET研究开发单位和语言教育专家都从不同的视角提出CET的改革发展方向(张尧学,2003,2008;金艳,2004,2006;王初明,2006;蔡基刚,2007)。基于分析CET复杂的测量学属性和它的多重功能,本文探讨了对CET争议的原因。
二、CET的测量学属性
分析CET的性质是理解对CET争议的重要视角之一。它本身是一个什么性质的考试,考试研发者期望它能满足什么样的功能,而质疑者认为它应该是什么样的考试,它应该在社会和教育界起什么样的作用,角度不同,答案也不一样,因此分析他们之间的偏差可以更好地理解对CET的争议。用来描述语言考试和评估的专有名词很多。根据不同的解释测试结果的参照系,心理测量研究人员通常把测试分为标准参照(criterion-referenced)和常模参照(norm-referenced)考试;根据考试内容选取的依据,考试通常分为学业考试(achievement test)和水平考试(proficiency test)(Bachman,1990;徐强,2000;束定芳 庄智象,1996);根据不同的评估型式,考试分为形成性(formative)和终结性(summative)评估。下文将以测试的不同分类方法为视角对CET的测量学属性进行剖析。
1.CET是常模参照-尺度相关的考试。心理测量理论认为如果测试的结果是参照某一标准进行解释(语言能力等级量表或教学大纲标准),该考试被称之为标准参照。比如雅思把语言能力分为十个等级,每一个等级用语言进行定性的描述,达到某个等级就表示该考生能用语言完成所描述的功能。根据雅思的能力等级量表如果一个考生“有能力运用英语,虽然在某些情况有时会发生不准确、不适当和误解,基本上能很好地掌握复杂的英语句子,也能理解推理的细节”,该考生的语言能力为七级。而常模参照考试是以某一常模作为参照系来解释考生的成绩。常模是由测试单位选取的,呈正态分布的用均值和标准差来进行描述的标准化样组。考生的成绩是以它在常模中所处的位置来解释的。如果某一考生的原始分数与常模的均值大一个标准差,他的能力就可以解释为比84.13%的考生强。因此,从分数解释的参照系的角度出发,CET是常模参照性的考试。常模是由北京大学,清华大学,上海交通大学,复旦大学,中国科技大学和西安交通大学本科生组成。这样选取常模是因为考试的最初设计测量对象是重点大学本科生。后来CET扩展到全国普通高校,并用小于常模均值一个标准差作为及格线(杨惠中