论文部分内容阅读
我国教育现代化的步伐不可拒绝,更不可阻挡,其教育考试测量的现代化步伐同样如此。2012年春,国家有关部门召开了专门的教育考试测量发展趋势理论研讨会,形成的共识就是,与世界各国一样,走向共同的人机对话的考试测量之路,才能够满足社会对大面积、多数量、高品质、客观、公正、科学的现代考试的要求。
标准化考试不应一概否定
上世纪90年代初期,当我们对标准化考试还在欣赏,还在一味追逐的时候,开始出现了对标准化考试进行批判的声音,且越来越强大,最终几乎要全面叫停。其理由是,标准化考试不适宜汉字文化圈的考试,不适合考中国的学生,不适应东方文化。最主要的缺陷是,不能够考察思维的过程,不适合用于考察含有复杂的多元答案的试题,尤其是不能够考察出人的丰富情感态度和价值观,只能够考察出最简单的记忆性的知识,以及简单的、机械的操作性能力。
这股强劲的批判之风吹刮到了本世纪,大有全盘推翻和砸碎旧世界,还我中华民族考试传统的革命气概。高考语文自然就出现了呼唤只考一篇作文的声音,要求完全按照科举时代的方法来进行21世纪高校招生中的语文考试。
就在世纪之交的前前后后,有两件事情给人们带来一些另外的思考。一是台湾地区的高考国文科的试题在中国大陆语文杂志上刊载后,让人惊呼:原来标准化考试语文也可以将试题命制得如此生动活泼,甚至深刻,原来我们实施的标准化考试太肤浅、太表面、太单一。二是一些学校对学生志愿的预填报,语文学科竟然是只看前面部分客观性选择题的得分,以此来推算学生正式高考可能会得到的分数,据说居然很准确。不看非选择试题部分,是因为教师阅卷的随意性太大,不值得作为准确测算依据。
在本世纪初课程改革的大潮中,国家考试中心没有屈从于一些报刊的舆论,就连高考语文试题也坚持了客观选择试题的比例在非作文部分也不得少于三分之一的原则。其理由是,只有这一部分,经计算机数据论证,才是比较科学客观的,而其余部分的人工阅卷,信度低,尤其是作文,基本没有什么区分价值。
可以说,对待现代西方国家教育考试测量中实施的标准化考试,不应该盲目生硬地全盘照搬,更不应该轻率鲁莽地一概否定,应该冷静下来,认真琢磨研究,认真学习借鉴,根据我国的教育实际与考试实践,逐步改造运用,以提高我国考试测量的科学化水平。
标准化考试是大势所趋
随着社会的转型和教育的转轨,我国教育测量考试正在经历着巨大的转变,由过去农业文明时代,全国举人进京面试,发展到今天,几乎人人都可以进大学读书的时代。考试面对着巨量的人群,如何保证客观公正,成为了教育考试的一个根本性的难题。如果我们还是坚持按照过去的考试阅卷方式进行,时间、财力、人力还能够保证吗?尤其是人力成本越来越高的当代,高考阅卷难以寻找低廉阅卷者的时候,只有逐步过渡到机器阅卷才能够最终解决试卷判阅的难题。
即使时间、财力、人力允许我们慢慢地、认真地来批阅试卷,但是,在多年阅卷实践中我们已经发现,同样一道试题,就是同一个人来判阅,也常常因为心情的不同,因为劳累、疲惫程度的不同,而对简要回答试题,尤其是简要论述试题给出了不同的分数,何况在紧张试卷判阅过程中,还常常发生误判、漏判的情况。
因此,可以大胆地预言,在不久的将来,我国大面积的教育考试测量,一定会走上世界各国已实行的、人机对话的标准化考试的轨道上去,之后,才是有条件地进行小批量的、专门化的加试与面试,对之前的大面积、大规模的考试进行补充与校正,以便更加精准地选拔出理想的人才。
提高标准化试题的命制与判阅的现代化
我们熟悉的推断题、论述题、证明题等,是不是还能够采用客观选择题的方式进行有效检测,在今天看来,的确需要讨论。国人对标准化考试的认识已经经历了几十年的实践检验与思考,其实已经明白了其中的一些道理。
首先,我们不能够继续使用高度集中统一,甚至专制的方式来看待和对待我们的学生答卷,我们的参考答案不能够再采用高度一致、高度简洁的结果来要求学生。要培养学生的创新精神和科学态度,就需要我们设置开放性的试题,并给出开放性试题回答的各种可能。英国类似于我国高考的母语考试,试卷五十页,答案五百页,包含了各种各样回答的可能。而我国的高考语文,试卷十四或十六页,答案只有大半页或一两页,根本没有在试题上进行开放性的检测,更没有设置更加开阔的回答空间。要解决此问题,就应该首先从命制试题开始,加大投入的力度,进行长时间深入的科学研究。美国中小学学科考试测量中心之类的机构有三千多人,每一学科有数百人在研究,而我国几乎是零。如果我们国家每一学科长年累月也有几百人在进行专门研究,相信不久的将来,甚至较短的时间内,也能够研究命制出能够展示一般思维过程的、带有逻辑证明和推理的试题出来,更不用说简要回答、简要论述类试题了。
其次,我们考试的目的也需要随着对命题研究的深入而发生变化。哪些内容、哪些项目可以转换测量,哪些能力需要达到一定程度之后单独检测,或者附上答卷单独判阅。日本的高考作文也是在考场上写的,但是不评分,只在录取时作为淘汰的参考。一般的大型考试是否应该完成所有的考试任务,包括高级思维能力测试,这也是值得思考与研究的。
再次,当前很多省份的网络阅卷,已经迈开了现代考试评阅技术的初步步伐,使用现代化手段去命制传统意义上的试题,这虽然不是严格意义上的标准化考试,但是,毕竟走出了关键性的一步。进一步的发展就是提高试题的命制与判阅的现代化,这就需要命制观念的大转变,命题技术的大提升,逐步走向人机对话的教育考试测评,从而减少人工评卷的误差。
最后,是作文阅卷的问题。多年来,人们几乎一致认为,作文是不可能采用机器判阅的,因此,在中国,是不可能有真正标准化考试的。我们要说,这种结论下得过早。犹如大半个世纪前,中国人,包括很多中国的有志之士都认为,汉字必须走世界各国拼音化的道路,结果,当上世纪90年代中期,我国解决了汉字电脑录入的难题之后,才发现我们的汉字原来也可以进入现代化行列。作文的机器评判同样如此。全世界都感到作文判阅是一个难题,但是,在美国和欧洲一些国家,正在不断研究和攻克这个难题,并在一些大型考试中加以运用。我国的作文评卷也多年受到批评。尽管非作文部分的试题占有90分,但是,被60分一道题的作文一下子全吞没了差异,长此以往,学生的学和教师的教,都会成为语文学科的严重心病。近些年,北师大的郑先生设想,将作文的60分一分为三,每一部分20分,分别考察学生的信息处理能力。如给出20张卡片,要求整理出百余字的概述;要求对某一说法或观点进行讨论,看看学生的说理思辨能力;再给出一篇没有结尾的微型小说,要求补写结尾。今年第四期的《中学语文教学》杂志上,署名杨晨等的文章就介绍了中文写作机器评卷的现状及发展,介绍了国外以及台湾等地的先期实验,介绍了中文写作机器评判的基本思路,即采用三个维度进行。一是语言材料,设定一些条件,看其丰富性、多样性如何,如,能不能使用关联词语使语言表达严谨;二是结构检测,看前后是否一致,是否不矛盾,是否完整;三是潜语义评判,看是否能够写出自己的真情实感,而不是人云亦云,拾人牙慧。
我国几千年考试传统的厚重包袱,要想很快抛开,去走教育考试测量现代化的道路,是比较困难的,这其间涉及了无数利益集团和强大习惯力量的潜意识的抵触与反抗,也考验着国家决策者们的眼光与魄力。但是,面对越来越浩大的参考人数,面对越来越民主公正的考试要求,面对越来越高昂的人力成本,面对越来越激烈竞争的就业和升学压力,我们的教育考试测量不可能再回到农业文明时代的朱砂批阅了,只能够顺应世界发展潮流,逐渐走上人机对话的教育考试测量现代化的道路,只能够走上越来越标准化、小众化、个性化的道路,这是时代的必然,也是谁也阻挡不了的趋势。
标准化考试不应一概否定
上世纪90年代初期,当我们对标准化考试还在欣赏,还在一味追逐的时候,开始出现了对标准化考试进行批判的声音,且越来越强大,最终几乎要全面叫停。其理由是,标准化考试不适宜汉字文化圈的考试,不适合考中国的学生,不适应东方文化。最主要的缺陷是,不能够考察思维的过程,不适合用于考察含有复杂的多元答案的试题,尤其是不能够考察出人的丰富情感态度和价值观,只能够考察出最简单的记忆性的知识,以及简单的、机械的操作性能力。
这股强劲的批判之风吹刮到了本世纪,大有全盘推翻和砸碎旧世界,还我中华民族考试传统的革命气概。高考语文自然就出现了呼唤只考一篇作文的声音,要求完全按照科举时代的方法来进行21世纪高校招生中的语文考试。
就在世纪之交的前前后后,有两件事情给人们带来一些另外的思考。一是台湾地区的高考国文科的试题在中国大陆语文杂志上刊载后,让人惊呼:原来标准化考试语文也可以将试题命制得如此生动活泼,甚至深刻,原来我们实施的标准化考试太肤浅、太表面、太单一。二是一些学校对学生志愿的预填报,语文学科竟然是只看前面部分客观性选择题的得分,以此来推算学生正式高考可能会得到的分数,据说居然很准确。不看非选择试题部分,是因为教师阅卷的随意性太大,不值得作为准确测算依据。
在本世纪初课程改革的大潮中,国家考试中心没有屈从于一些报刊的舆论,就连高考语文试题也坚持了客观选择试题的比例在非作文部分也不得少于三分之一的原则。其理由是,只有这一部分,经计算机数据论证,才是比较科学客观的,而其余部分的人工阅卷,信度低,尤其是作文,基本没有什么区分价值。
可以说,对待现代西方国家教育考试测量中实施的标准化考试,不应该盲目生硬地全盘照搬,更不应该轻率鲁莽地一概否定,应该冷静下来,认真琢磨研究,认真学习借鉴,根据我国的教育实际与考试实践,逐步改造运用,以提高我国考试测量的科学化水平。
标准化考试是大势所趋
随着社会的转型和教育的转轨,我国教育测量考试正在经历着巨大的转变,由过去农业文明时代,全国举人进京面试,发展到今天,几乎人人都可以进大学读书的时代。考试面对着巨量的人群,如何保证客观公正,成为了教育考试的一个根本性的难题。如果我们还是坚持按照过去的考试阅卷方式进行,时间、财力、人力还能够保证吗?尤其是人力成本越来越高的当代,高考阅卷难以寻找低廉阅卷者的时候,只有逐步过渡到机器阅卷才能够最终解决试卷判阅的难题。
即使时间、财力、人力允许我们慢慢地、认真地来批阅试卷,但是,在多年阅卷实践中我们已经发现,同样一道试题,就是同一个人来判阅,也常常因为心情的不同,因为劳累、疲惫程度的不同,而对简要回答试题,尤其是简要论述试题给出了不同的分数,何况在紧张试卷判阅过程中,还常常发生误判、漏判的情况。
因此,可以大胆地预言,在不久的将来,我国大面积的教育考试测量,一定会走上世界各国已实行的、人机对话的标准化考试的轨道上去,之后,才是有条件地进行小批量的、专门化的加试与面试,对之前的大面积、大规模的考试进行补充与校正,以便更加精准地选拔出理想的人才。
提高标准化试题的命制与判阅的现代化
我们熟悉的推断题、论述题、证明题等,是不是还能够采用客观选择题的方式进行有效检测,在今天看来,的确需要讨论。国人对标准化考试的认识已经经历了几十年的实践检验与思考,其实已经明白了其中的一些道理。
首先,我们不能够继续使用高度集中统一,甚至专制的方式来看待和对待我们的学生答卷,我们的参考答案不能够再采用高度一致、高度简洁的结果来要求学生。要培养学生的创新精神和科学态度,就需要我们设置开放性的试题,并给出开放性试题回答的各种可能。英国类似于我国高考的母语考试,试卷五十页,答案五百页,包含了各种各样回答的可能。而我国的高考语文,试卷十四或十六页,答案只有大半页或一两页,根本没有在试题上进行开放性的检测,更没有设置更加开阔的回答空间。要解决此问题,就应该首先从命制试题开始,加大投入的力度,进行长时间深入的科学研究。美国中小学学科考试测量中心之类的机构有三千多人,每一学科有数百人在研究,而我国几乎是零。如果我们国家每一学科长年累月也有几百人在进行专门研究,相信不久的将来,甚至较短的时间内,也能够研究命制出能够展示一般思维过程的、带有逻辑证明和推理的试题出来,更不用说简要回答、简要论述类试题了。
其次,我们考试的目的也需要随着对命题研究的深入而发生变化。哪些内容、哪些项目可以转换测量,哪些能力需要达到一定程度之后单独检测,或者附上答卷单独判阅。日本的高考作文也是在考场上写的,但是不评分,只在录取时作为淘汰的参考。一般的大型考试是否应该完成所有的考试任务,包括高级思维能力测试,这也是值得思考与研究的。
再次,当前很多省份的网络阅卷,已经迈开了现代考试评阅技术的初步步伐,使用现代化手段去命制传统意义上的试题,这虽然不是严格意义上的标准化考试,但是,毕竟走出了关键性的一步。进一步的发展就是提高试题的命制与判阅的现代化,这就需要命制观念的大转变,命题技术的大提升,逐步走向人机对话的教育考试测评,从而减少人工评卷的误差。
最后,是作文阅卷的问题。多年来,人们几乎一致认为,作文是不可能采用机器判阅的,因此,在中国,是不可能有真正标准化考试的。我们要说,这种结论下得过早。犹如大半个世纪前,中国人,包括很多中国的有志之士都认为,汉字必须走世界各国拼音化的道路,结果,当上世纪90年代中期,我国解决了汉字电脑录入的难题之后,才发现我们的汉字原来也可以进入现代化行列。作文的机器评判同样如此。全世界都感到作文判阅是一个难题,但是,在美国和欧洲一些国家,正在不断研究和攻克这个难题,并在一些大型考试中加以运用。我国的作文评卷也多年受到批评。尽管非作文部分的试题占有90分,但是,被60分一道题的作文一下子全吞没了差异,长此以往,学生的学和教师的教,都会成为语文学科的严重心病。近些年,北师大的郑先生设想,将作文的60分一分为三,每一部分20分,分别考察学生的信息处理能力。如给出20张卡片,要求整理出百余字的概述;要求对某一说法或观点进行讨论,看看学生的说理思辨能力;再给出一篇没有结尾的微型小说,要求补写结尾。今年第四期的《中学语文教学》杂志上,署名杨晨等的文章就介绍了中文写作机器评卷的现状及发展,介绍了国外以及台湾等地的先期实验,介绍了中文写作机器评判的基本思路,即采用三个维度进行。一是语言材料,设定一些条件,看其丰富性、多样性如何,如,能不能使用关联词语使语言表达严谨;二是结构检测,看前后是否一致,是否不矛盾,是否完整;三是潜语义评判,看是否能够写出自己的真情实感,而不是人云亦云,拾人牙慧。
我国几千年考试传统的厚重包袱,要想很快抛开,去走教育考试测量现代化的道路,是比较困难的,这其间涉及了无数利益集团和强大习惯力量的潜意识的抵触与反抗,也考验着国家决策者们的眼光与魄力。但是,面对越来越浩大的参考人数,面对越来越民主公正的考试要求,面对越来越高昂的人力成本,面对越来越激烈竞争的就业和升学压力,我们的教育考试测量不可能再回到农业文明时代的朱砂批阅了,只能够顺应世界发展潮流,逐渐走上人机对话的教育考试测量现代化的道路,只能够走上越来越标准化、小众化、个性化的道路,这是时代的必然,也是谁也阻挡不了的趋势。