论文部分内容阅读
摘 要:大学英语分级教学已成为大学英语教学改革的重要方向,但分级教学中评价公平性的质疑制约着分级教学的发展,垂直等值以学生能力估计为目标,可以将不同级别的测试分数转化到相同的评价尺度,从而为分级教学评价提供了参考。结合本校大学英语分级教学,探讨了垂直等值在分级教学评价中的应用方法。
关鍵词:大学英语;分级教学;评价方法;垂直等值
根据《大学英语课程教学要求》中“分类指导、因材施教”的要求,各高校在大学英语教学中普遍开展分级教学,即在学生入学之初,按照成绩高低将学生分成高、低两个等级或高、中低三个等级,进行差异化教学。这一模式根据学生个体差异,在课程设置、教学内容、教学实施等方面进行分类指导,满足学生个性化的学习需求,体现了因材施教,在提高教学效率,改善教学质量等方面起到了积极作用,逐渐成为大学英语教学改革的重要方向。但是,在分级教学中也存在一些不可避免的问题。针对不同级别、不同水平的学生,仍然采用传统的“一刀切”的测试评价方式,在有效性和公平性方面饱受质疑,严重制约了分级教学的发展。针对这样的问题,引入心理测量学研究领域中的垂直量表化方法,建立垂直量表体系,能够为解决大学英语分级教学的测试评价问题提供思路。
一、大学英语分级教学测试评价现状
评价是教学系统中一个重要环节,是教师获取教学反馈信息,改进教学管理、保证教学质量的重要依据,也是学生调整学习策略,改进学习方法、提高学习效率的重要手段。随着分级教学的开展,如何进行科学、公平的评价也逐渐引起人们重视,开展了广泛的研究。刘怀生[1]构建了大学英语分级教学形成性评价体系,张爱玲[2]提出采用分阶段性评价和影响因子等方法实现分级教学多元多层次综合评价,以克服评价过程中多因素差异性评价带来的不公,达到客观公正。刘艳[3]研究了大学英语分级教学教师教学效果评价方案。
目前,分级教学评价通常采用形成性评价和考试评价相结合的方法,但是,由于分级教学在教材选择、内容安排、知识点设置、目标要求等方面存在一定的差异,考核评价时,如果采用相同的试卷,题目的难易程度较难把握,题目较难对于低级别的学生有失公平,题目容易则难以反应因材施教的效果;而如果按照不同级别采用不同的试卷进行考核,英语单科成绩可能会影响到一个学生的综合测评,毕竟A级中85分和B级中的85分所代表的能力是不同的。因此,实现不同级别间分级考核成绩的等值,对于解决分级考核公平性问题具有重要的意义。
二、垂直等值
垂直等值开始于心理学研究领域,由法国心理学家比奈提出,也叫垂直等值或垂直链接。垂直等值是通过将不同水平测试的试题等值到同一量表上,估计每个级别每位考生的能力,将学生在各个级别水平测试的表现转换到同一分数尺度上,使不同水平的测试结果能够进行比较。
目前,垂直量表化已成为大规模标准化测验中不可或缺的一个重要环节。美国在2002年就开始采用垂直量表体系,将不同年级的评估结果放到一个共同的量表中进行衡量从而来检测学生进步,TOFEL和GRE更是测试领域垂直量表化应用的典范。而在我国,如何使测试评价体系更公正一直备受关注,但从现有的文献我们可以发现,多数研究侧重于水平量表的研究,而垂直量表的研究相对较少,2010年王烨晖[]等提到了垂直等值的概念,此后,关宁[4]等对垂直量表体系在大学英语分级测试中的可行性进行了探讨,但真正实现大学英语分级测试的垂直量表化还需要大量研究工作。
三、垂直等值在大学英语分级教学评价中的应用
本研究旨在将探讨垂直等值在大学英语分级教学评价中的应用,探讨不同级别之间等值方法,并为学生发展性量表的建立提供数据基础,因此,在构建过程中结合本校大学英语分级教学办法,将学生分为A、B两个级别,其中A级为高级别,B级为低级别。考虑到成长性量表的构建,将两个年级同时纳入评价范围,将其分为A1,A2,B1,B2四个级别。各级别能力要求按照A2>B2>A1>B1。
构建垂直量表通常包括数据收集方案设计、模型选择、参数估计方法选择、构建垂直等值量表四大步骤。每个步骤都对等值结果产生一定的影响,因此,在设计过程中,要充分考虑各种因素,减小等值误差。
(一)数据收集方案设计
垂直等值有三种基本的数据收集设计方案:锚题设计、等组设计和锚测试设计。其中,锚题设计不需要额外的测试,最容易实施,应用也较为广泛。
锚题是各级别之间的链接,锚题的质量直接关系到等值的可靠性,黎光明[5]认为,当锚题比例为30%时,垂直等值的精度相对最高,产生的等值误差相对最小,因此,在不考虑其它条件影响的情况下,锚题比例设为30%。锚题设计如图1所示:
在题型选择上,大学英语测试通常包括:听力、词汇、阅读、翻译、写作等五部分内容,其中,听力、词汇、阅读为客观性试题,题目较多,评分客观,较容易满足等值条件,但容易引入猜测误差;翻译、写作为主观性试题,能够反映学生的真实能力,但等值难度较大,评分容易受到评分者效应影响,等值难度较大,目前尚缺乏有效的方法,因此,在锚题选择上采用客观性试题进行链接。并在题目选择上,选取难度、区分度适中的题目,避免过难或过容易的题目。
(二)等值模型选择。垂直等值有三种基本分数转换方法,即Thurstone方法、Hieronymus方法和项目反应理论(简称IRT)方法。IRT方法根据被试者的作答模式估计被试者的能力值,不需要考虑被试的能力分布,因此,该方法已逐渐成为垂直等值量表构建的主要方法。
(三)参数估计
参数估计是把不同能力的测试数据转换到同一尺度上,以构建共同量表。常用的估计方法有分别估计和同时估计。分别估计对每个级别成绩的参数进行估计,然后利用链接,通过回归法、平均数法、标准差法、Stocking-Lord法等方法,将项目参数估计放在同一量表上,是一种比较保险的方法。同时估计将所有级别的测试数据同时进行估计,一般能产生稳定的结果。
(四)垂直等值量表的构建
能力水平的估计是在等值量表的基础上估计学生的能力水平,构建垂直量表,常用的方法有极大似然估计、期望后验估计和极大后验估计等方法估算各级别所有考生的能力值,然后采用线性转换公式,可计算出各级别考生在新量表上的平均分和标准差将其转换为常规分数。从而讲各个级别的分数统一到相同的尺度上。
(五)垂直量表在评价中的应用
为体现评价公平性,尤其是学生关心的分数对奖学金评比,评优、评比等问题,应用垂直等值量表对于同一年级不同级别的学生进行等值。同时,构建不同年级、级别之间的等值量表,对跨年级级别之间的量表分数进行比较,检验学生是否该级别达到该级别预期的目标,作为学生进步幅度的评价指标。
四、结论
在本校大学英语分级教学中,结合期末考试探索了垂直量表在分级教学中的应用,构建了不同年级、级别之间的等值垂直量表,其结果可以为学生分级评价及发展评价提供参考。但是由于垂直量表构建过程中影响因素较多,如:分级测试中样本量、锚题质量、题目难度、区分度、方法的选择等都会影响等值的效果,目前尚缺少统一有效的方法,有待于进一步进行研究。
参考文献
[1]刘怀生,刘光成.大学英语分级教学形成性评价体系构建[J],课程研究,2019.07:46-47.
[2]张爱玲,陶华.高职英语分级教学中差异化评价的公平性研究[J],江苏建筑职业技术学院学报,2019.12:58-61.
[3]刘艳.大学英语分级教学教师教学效果评价方案的研究[J].辽宁科技学院学报,2017,19(5):58-59.
[4]黎光明,梁正妍.锚题比例与年级离散度对垂直等值的影响[J].江西师范大学学报(自然科学版),2019.1:52-58.
[5]关宁,陈福明.大学英语分级测试垂直量表体系构建的可行性探析[J].黑龙江教育(高教研究与评估),2016.06:54-55.
课题信息:“本文系2017年河北省高等学校社科研究年度基金项目(项目编号SQ171190)研究成果”
关鍵词:大学英语;分级教学;评价方法;垂直等值
根据《大学英语课程教学要求》中“分类指导、因材施教”的要求,各高校在大学英语教学中普遍开展分级教学,即在学生入学之初,按照成绩高低将学生分成高、低两个等级或高、中低三个等级,进行差异化教学。这一模式根据学生个体差异,在课程设置、教学内容、教学实施等方面进行分类指导,满足学生个性化的学习需求,体现了因材施教,在提高教学效率,改善教学质量等方面起到了积极作用,逐渐成为大学英语教学改革的重要方向。但是,在分级教学中也存在一些不可避免的问题。针对不同级别、不同水平的学生,仍然采用传统的“一刀切”的测试评价方式,在有效性和公平性方面饱受质疑,严重制约了分级教学的发展。针对这样的问题,引入心理测量学研究领域中的垂直量表化方法,建立垂直量表体系,能够为解决大学英语分级教学的测试评价问题提供思路。
一、大学英语分级教学测试评价现状
评价是教学系统中一个重要环节,是教师获取教学反馈信息,改进教学管理、保证教学质量的重要依据,也是学生调整学习策略,改进学习方法、提高学习效率的重要手段。随着分级教学的开展,如何进行科学、公平的评价也逐渐引起人们重视,开展了广泛的研究。刘怀生[1]构建了大学英语分级教学形成性评价体系,张爱玲[2]提出采用分阶段性评价和影响因子等方法实现分级教学多元多层次综合评价,以克服评价过程中多因素差异性评价带来的不公,达到客观公正。刘艳[3]研究了大学英语分级教学教师教学效果评价方案。
目前,分级教学评价通常采用形成性评价和考试评价相结合的方法,但是,由于分级教学在教材选择、内容安排、知识点设置、目标要求等方面存在一定的差异,考核评价时,如果采用相同的试卷,题目的难易程度较难把握,题目较难对于低级别的学生有失公平,题目容易则难以反应因材施教的效果;而如果按照不同级别采用不同的试卷进行考核,英语单科成绩可能会影响到一个学生的综合测评,毕竟A级中85分和B级中的85分所代表的能力是不同的。因此,实现不同级别间分级考核成绩的等值,对于解决分级考核公平性问题具有重要的意义。
二、垂直等值
垂直等值开始于心理学研究领域,由法国心理学家比奈提出,也叫垂直等值或垂直链接。垂直等值是通过将不同水平测试的试题等值到同一量表上,估计每个级别每位考生的能力,将学生在各个级别水平测试的表现转换到同一分数尺度上,使不同水平的测试结果能够进行比较。
目前,垂直量表化已成为大规模标准化测验中不可或缺的一个重要环节。美国在2002年就开始采用垂直量表体系,将不同年级的评估结果放到一个共同的量表中进行衡量从而来检测学生进步,TOFEL和GRE更是测试领域垂直量表化应用的典范。而在我国,如何使测试评价体系更公正一直备受关注,但从现有的文献我们可以发现,多数研究侧重于水平量表的研究,而垂直量表的研究相对较少,2010年王烨晖[]等提到了垂直等值的概念,此后,关宁[4]等对垂直量表体系在大学英语分级测试中的可行性进行了探讨,但真正实现大学英语分级测试的垂直量表化还需要大量研究工作。
三、垂直等值在大学英语分级教学评价中的应用
本研究旨在将探讨垂直等值在大学英语分级教学评价中的应用,探讨不同级别之间等值方法,并为学生发展性量表的建立提供数据基础,因此,在构建过程中结合本校大学英语分级教学办法,将学生分为A、B两个级别,其中A级为高级别,B级为低级别。考虑到成长性量表的构建,将两个年级同时纳入评价范围,将其分为A1,A2,B1,B2四个级别。各级别能力要求按照A2>B2>A1>B1。
构建垂直量表通常包括数据收集方案设计、模型选择、参数估计方法选择、构建垂直等值量表四大步骤。每个步骤都对等值结果产生一定的影响,因此,在设计过程中,要充分考虑各种因素,减小等值误差。
(一)数据收集方案设计
垂直等值有三种基本的数据收集设计方案:锚题设计、等组设计和锚测试设计。其中,锚题设计不需要额外的测试,最容易实施,应用也较为广泛。
锚题是各级别之间的链接,锚题的质量直接关系到等值的可靠性,黎光明[5]认为,当锚题比例为30%时,垂直等值的精度相对最高,产生的等值误差相对最小,因此,在不考虑其它条件影响的情况下,锚题比例设为30%。锚题设计如图1所示:
在题型选择上,大学英语测试通常包括:听力、词汇、阅读、翻译、写作等五部分内容,其中,听力、词汇、阅读为客观性试题,题目较多,评分客观,较容易满足等值条件,但容易引入猜测误差;翻译、写作为主观性试题,能够反映学生的真实能力,但等值难度较大,评分容易受到评分者效应影响,等值难度较大,目前尚缺乏有效的方法,因此,在锚题选择上采用客观性试题进行链接。并在题目选择上,选取难度、区分度适中的题目,避免过难或过容易的题目。
(二)等值模型选择。垂直等值有三种基本分数转换方法,即Thurstone方法、Hieronymus方法和项目反应理论(简称IRT)方法。IRT方法根据被试者的作答模式估计被试者的能力值,不需要考虑被试的能力分布,因此,该方法已逐渐成为垂直等值量表构建的主要方法。
(三)参数估计
参数估计是把不同能力的测试数据转换到同一尺度上,以构建共同量表。常用的估计方法有分别估计和同时估计。分别估计对每个级别成绩的参数进行估计,然后利用链接,通过回归法、平均数法、标准差法、Stocking-Lord法等方法,将项目参数估计放在同一量表上,是一种比较保险的方法。同时估计将所有级别的测试数据同时进行估计,一般能产生稳定的结果。
(四)垂直等值量表的构建
能力水平的估计是在等值量表的基础上估计学生的能力水平,构建垂直量表,常用的方法有极大似然估计、期望后验估计和极大后验估计等方法估算各级别所有考生的能力值,然后采用线性转换公式,可计算出各级别考生在新量表上的平均分和标准差将其转换为常规分数。从而讲各个级别的分数统一到相同的尺度上。
(五)垂直量表在评价中的应用
为体现评价公平性,尤其是学生关心的分数对奖学金评比,评优、评比等问题,应用垂直等值量表对于同一年级不同级别的学生进行等值。同时,构建不同年级、级别之间的等值量表,对跨年级级别之间的量表分数进行比较,检验学生是否该级别达到该级别预期的目标,作为学生进步幅度的评价指标。
四、结论
在本校大学英语分级教学中,结合期末考试探索了垂直量表在分级教学中的应用,构建了不同年级、级别之间的等值垂直量表,其结果可以为学生分级评价及发展评价提供参考。但是由于垂直量表构建过程中影响因素较多,如:分级测试中样本量、锚题质量、题目难度、区分度、方法的选择等都会影响等值的效果,目前尚缺少统一有效的方法,有待于进一步进行研究。
参考文献
[1]刘怀生,刘光成.大学英语分级教学形成性评价体系构建[J],课程研究,2019.07:46-47.
[2]张爱玲,陶华.高职英语分级教学中差异化评价的公平性研究[J],江苏建筑职业技术学院学报,2019.12:58-61.
[3]刘艳.大学英语分级教学教师教学效果评价方案的研究[J].辽宁科技学院学报,2017,19(5):58-59.
[4]黎光明,梁正妍.锚题比例与年级离散度对垂直等值的影响[J].江西师范大学学报(自然科学版),2019.1:52-58.
[5]关宁,陈福明.大学英语分级测试垂直量表体系构建的可行性探析[J].黑龙江教育(高教研究与评估),2016.06:54-55.
课题信息:“本文系2017年河北省高等学校社科研究年度基金项目(项目编号SQ171190)研究成果”